空间转录组

1. 空间转录组简介
空间转录组(Spatial Transcriptomics, ST)是一种结合空间信息和基因表达信息的技术,能够在组织切片上解析基因表达的空间分布模式。这一技术克服了传统单细胞转录组(scRNA-seq)失去空间信息的局限,使得科学家可以在组织结构背景下研究基因表达的变化。
2. 空间转录组的技术原理
空间转录组技术的核心在于:
-
通过特定方法固定组织切片,并保持mRNA在原位。
-
利用特殊的空间定位标记(如条形码、荧光探针等)进行mRNA捕获或标记。
-
通过高通量测序获取mRNA序列信息,并结合空间条形码将基因表达信息映射回原始组织位置。
-
结合生物信息学分析,重建空间基因表达图谱。
3. 主要空间转录组技术
目前,空间转录组技术可以分为两大类:
(1) 基于原位测序和荧光杂交的技术
-
MERFISH(Multiplexed Error-Robust Fluorescence In Situ Hybridization)
-
通过荧光原位杂交(FISH)标记RNA分子,并结合条形码编码,实现高通量基因检测。
-
适用于已知基因集合的空间表达分析。
-
-
seqFISH+(Sequential Fluorescence In Situ Hybridization)
-
通过多轮荧光原位杂交(FISH),能同时检测数千种转录本的空间分布。
-
-
STARmap(Spatially Resolved Transcript Amplicon Readout Mapping)
-
采用水凝胶固定RNA,并利用空间编码的扩增探针进行测序。
-
可用于3D组织样本的基因表达分析。
-
(2) 基于捕获测序的技术
-
Visium(10x Genomics)
-
采用玻片芯片技术,在组织切片下方铺设含有条形码的捕获探针,通过高通量测序解析mRNA的空间信息。
-
-
Slide-seq
-
采用微珠阵列,每个微珠都带有唯一的空间条形码,可用于小鼠大脑等复杂组织的研究。
-
-
HDST(High-Definition Spatial Transcriptomics)
-
采用超高密度的空间捕获阵列,分辨率比Visium更高。
-
-
Stereo-seq(Spatial Enhanced Resolution Omics Sequencing)
-
由华大基因开发,利用DNA纳米球(DNB)技术实现超高分辨率的空间转录组测序。
-
4. 空间转录组的应用
(1) 肿瘤微环境研究
-
解析肿瘤组织中不同细胞类型的空间分布,如免疫细胞、肿瘤细胞、成纤维细胞等。
-
研究肿瘤异质性及不同区域的基因表达模式,识别潜在治疗靶点。
(2) 组织发育与再生研究
-
研究胚胎发育过程中基因表达的时空动态变化。
-
分析再生组织中不同细胞类型的重塑过程。
(3) 神经科学研究
-
解析大脑皮层、海马等区域的基因表达图谱,研究神经元的功能分区。
-
结合单细胞转录组研究阿尔茨海默病等神经退行性疾病的病理机制。
(4) 免疫系统研究
-
研究淋巴结、脾脏等免疫器官中免疫细胞的空间分布。
-
解析感染性疾病或自身免疫疾病的空间免疫反应。
5. 空间转录组数据分析
(1) 主要分析流程
-
原始数据处理
-
质控:去除低质量的测序数据和背景噪声。
-
空间定位:将测序数据映射到组织切片的物理坐标。
-
-
归一化和降维
-
进行数据归一化(如log-normalization)。
-
采用PCA、t-SNE或UMAP等方法进行降维分析。
-
-
细胞类型鉴定
-
通过已知的细胞标志基因(marker genes)注释细胞类型。
-
结合单细胞转录组数据进行整合分析。
-
-
空间差异基因分析
-
识别不同区域的差异基因表达情况。
-
分析基因共表达网络,探索调控机制。
-
-
空间组织亚区分割
-
采用聚类算法(如K-means、Louvain)识别组织中的功能区域。
-
结合解剖学信息进行功能解析。
-
-
通路富集分析
-
采用GO(Gene Ontology)、KEGG(Kyoto Encyclopedia of Genes and Genomes)等数据库分析基因功能。
-
(2) 主要分析工具
- Seurat
-
适用于Visium等数据的空间基因表达分析。
-
- SpatialDE
-
用于检测空间差异基因。
-
- SPARK(Spatial PAttern Recognition via Kernels)
-
识别基因的空间模式。
-
- Scanpy
-
适用于大规模空间转录组数据分析。
-
6. 空间转录组的挑战与未来发展
(1) 主要挑战
- 空间分辨率限制
-
目前大多数方法的分辨率仍有限,难以达到单细胞水平(除MERFISH、seqFISH等)。
-
- 数据分析复杂
-
需要结合空间信息、基因表达、解剖学知识等进行综合分析。
-
- 成本较高
-
高通量测序和实验成本仍然较高,限制了其广泛应用。
-
(2) 未来发展趋势
- 提高空间分辨率
-
发展更高分辨率的捕获芯片和原位测序技术,实现单细胞甚至亚细胞水平的分析。
-
- 多组学整合
-
结合空间蛋白组、表观组学等多维度信息,解析更完整的生物学网络。
-
- AI与计算优化
-
采用机器学习和深度学习优化空间转录组数据的分析方法,提高预测准确性。
-
7. 结论
空间转录组技术为生命科学研究提供了一种全新的视角,使得科学家能够在空间维度解析基因表达模式。随着技术的不断进步,空间转录组将会在基础研究、临床应用和精准医学中发挥越来越重要的作用。
以下是一个空间转录组(Spatial Transcriptomics, ST) 数据分析代码流程示例,主要基于 10x Genomics Visium 平台,并使用 Seurat 和 SpatialExperiment 进行分析。流程涵盖数据导入、预处理、归一化、降维聚类、空间可视化、差异表达分析等步骤。
1. 安装必要的 R 包
在开始分析之前,需要安装以下 R 包:
# 安装 Bioconductor 包管理器if (!requireNamespace("BiocManager", quietly = TRUE))install.packages("BiocManager")# 安装所需 R 包BiocManager::install(c("Seurat", "SpatialExperiment", "scater", "spatialLIBD"))# 其他必要依赖install.packages(c("ggplot2", "patchwork", "dplyr"))
2. 载入数据
10x Visium 的空间转录组数据通常包含:
- filtered_feature_bc_matrix/
(基因表达矩阵)
- spatial/
(空间定位信息,包括影像)
- scalefactors_json.json
(缩放比例信息)
使用 Seurat 加载 Visium 数据:
library(Seurat)library(ggplot2)library(patchwork)# 读取 Visium 数据data_dir <- "path_to_your_data" # 修改为实际数据路径st_data <- Load10X_Spatial(data.dir = data_dir)# 查看数据基本信息print(st_data)
3. 质量控制(QC)
质量控制的目的是去除低质量 spot(空间点),确保数据可靠性。
# 查看原始数据的质控指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)# 过滤低质量 spotst_data <- subset(st_data, subset = nFeature_Spatial > 200 & nFeature_Spatial < 5000 & percent.mt < 5)# 重新绘制 QC 指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)
4. 归一化 & 维度缩减
为了去除测序深度的影响,需要对数据进行归一化,并进行 PCA 降维。
# 归一化数据(使用 SCTransform 或 LogNormalize)st_data <- SCTransform(st_data, assay = "Spatial", verbose = FALSE)# 运行 PCA 降维st_data <- RunPCA(st_data, verbose = FALSE)# 查看 PCA 结果ElbowPlot(st_data)
5. 空间聚类分析
在降维的基础上,进行聚类分析,识别组织中的不同区域。
# 计算最近邻st_data <- FindNeighbors(st_data, dims = 1:10)# 进行聚类st_data <- FindClusters(st_data, resolution = 0.5)# 运行 UMAPst_data <- RunUMAP(st_data, dims = 1:10)# 绘制聚类结果DimPlot(st_data, reduction = "umap", group.by = "seurat_clusters")
6. 空间可视化
利用 SpatialFeaturePlot 和 SpatialDimPlot 进行可视化,探索基因在组织中的表达模式。
# 可视化聚类结果SpatialDimPlot(st_data, label = TRUE, label.size = 3)# 可视化某些基因的空间表达情况SpatialFeaturePlot(st_data, features = c("GFAP", "MBP", "PDGFRA"))
7. 差异表达分析
计算不同组织区域之间的差异表达基因(DEGs)。
# 选择某一聚类进行差异表达分析cluster_markers <- FindMarkers(st_data, ident.1 = 0, ident.2 = 1, min.pct = 0.25)# 显示前 10 个差异基因head(cluster_markers, 10)# 可视化某些基因的表达VlnPlot(st_data, features = c("GFAP", "MBP"), group.by = "seurat_clusters")
8. 结合单细胞数据进行空间注释
如果有单细胞数据(scRNA-seq),可以整合到空间转录组数据中。
library(SingleCellExperiment)# 加载单细胞数据sce <- readRDS("path_to_single_cell_data.rds")# 识别细胞类型标志基因cell_markers <- FindAllMarkers(sce)# 映射到空间数据st_data <- AddModuleScore(st_data, features = list(cell_markers$gene), name = "CellType")# 进行可视化SpatialFeaturePlot(st_data, features = "CellType1")
9. 其他空间分析
(1) 组织区域分割
library(spatialLIBD)# 计算空间特征spatial_clusters <- spatialLIBD::layer_stat(st_data)# 可视化plot_layer_diagnostics(spatial_clusters)
(2) 空间相关性分析
library(SpatialExperiment)# 计算空间自相关性spatial_correlation <- cor(st_data@assays$Spatial@data)# 可视化相关性矩阵pheatmap::pheatmap(spatial_correlation)
10. 结果导出
将分析结果保存,供后续使用。
# 保存 Seurat 对象saveRDS(st_data, file = "st_analysis_results.rds")# 导出差异表达基因write.csv(cluster_markers, file = "DEG_results.csv", row.names = TRUE)
总结
以上代码提供了一个完整的空间转录组(ST)数据分析流程,涵盖:
- 数据加载
- 质量控制
- 归一化 & 降维
- 空间聚类
- 空间可视化
- 差异表达分析
- 结合单细胞数据
- 空间相关性分析
- 结果导出
这一流程可以根据具体的实验需求进行优化,比如更换不同的归一化方法(SCTransform 或 LogNormalize)、调整聚类分辨率、或者采用 SPARK-X 进行空间模式识别。
生信大白记第56记,就到这里,关注我!
下一记,持续更新学习生物信息学的内容!
生信大白记邮箱账号:shengxindabaiji@163.com
生信大白记简书账号:生信大白记
生信大白记CSDN账号:生信大白记
生信大白记微信公众号:生信大白记
加入生信大白记交流群938339543
2万+

被折叠的 条评论
为什么被折叠?



