空间转录组

最新推荐文章于 2025-07-22 21:50:54 发布

原创最新推荐文章于 2025-07-22 21:50:54 发布 · 2.6k 阅读

19 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

该文章已生成可运行项目，

空间转录组

1. 空间转录组简介

空间转录组（Spatial Transcriptomics, ST）是一种结合空间信息和基因表达信息的技术，能够在组织切片上解析基因表达的空间分布模式。这一技术克服了传统单细胞转录组（scRNA-seq）失去空间信息的局限，使得科学家可以在组织结构背景下研究基因表达的变化。

2. 空间转录组的技术原理

空间转录组技术的核心在于：

通过特定方法固定组织切片，并保持mRNA在原位。
利用特殊的空间定位标记（如条形码、荧光探针等）进行mRNA捕获或标记。
通过高通量测序获取mRNA序列信息，并结合空间条形码将基因表达信息映射回原始组织位置。
结合生物信息学分析，重建空间基因表达图谱。

3. 主要空间转录组技术

目前，空间转录组技术可以分为两大类：

(1) 基于原位测序和荧光杂交的技术

MERFISH（Multiplexed Error-Robust Fluorescence In Situ Hybridization）
- 通过荧光原位杂交（FISH）标记RNA分子，并结合条形码编码，实现高通量基因检测。
- 适用于已知基因集合的空间表达分析。
seqFISH+（Sequential Fluorescence In Situ Hybridization）
- 通过多轮荧光原位杂交（FISH），能同时检测数千种转录本的空间分布。
STARmap（Spatially Resolved Transcript Amplicon Readout Mapping）
- 采用水凝胶固定RNA，并利用空间编码的扩增探针进行测序。
- 可用于3D组织样本的基因表达分析。

(2) 基于捕获测序的技术

Visium（10x Genomics）
- 采用玻片芯片技术，在组织切片下方铺设含有条形码的捕获探针，通过高通量测序解析mRNA的空间信息。
Slide-seq
- 采用微珠阵列，每个微珠都带有唯一的空间条形码，可用于小鼠大脑等复杂组织的研究。
HDST（High-Definition Spatial Transcriptomics）
- 采用超高密度的空间捕获阵列，分辨率比Visium更高。
Stereo-seq（Spatial Enhanced Resolution Omics Sequencing）
- 由华大基因开发，利用DNA纳米球（DNB）技术实现超高分辨率的空间转录组测序。

4. 空间转录组的应用

(1) 肿瘤微环境研究

解析肿瘤组织中不同细胞类型的空间分布，如免疫细胞、肿瘤细胞、成纤维细胞等。
研究肿瘤异质性及不同区域的基因表达模式，识别潜在治疗靶点。

(2) 组织发育与再生研究

研究胚胎发育过程中基因表达的时空动态变化。
分析再生组织中不同细胞类型的重塑过程。

(3) 神经科学研究

解析大脑皮层、海马等区域的基因表达图谱，研究神经元的功能分区。
结合单细胞转录组研究阿尔茨海默病等神经退行性疾病的病理机制。

(4) 免疫系统研究

研究淋巴结、脾脏等免疫器官中免疫细胞的空间分布。
解析感染性疾病或自身免疫疾病的空间免疫反应。

5. 空间转录组数据分析

(1) 主要分析流程

原始数据处理
- 质控：去除低质量的测序数据和背景噪声。
- 空间定位：将测序数据映射到组织切片的物理坐标。
归一化和降维
- 进行数据归一化（如log-normalization）。
- 采用PCA、t-SNE或UMAP等方法进行降维分析。
细胞类型鉴定
- 通过已知的细胞标志基因（marker genes）注释细胞类型。
- 结合单细胞转录组数据进行整合分析。
空间差异基因分析
- 识别不同区域的差异基因表达情况。
- 分析基因共表达网络，探索调控机制。
空间组织亚区分割
- 采用聚类算法（如K-means、Louvain）识别组织中的功能区域。
- 结合解剖学信息进行功能解析。
通路富集分析
- 采用GO（Gene Ontology）、KEGG（Kyoto Encyclopedia of Genes and Genomes）等数据库分析基因功能。

(2) 主要分析工具

Seurat
- 适用于Visium等数据的空间基因表达分析。
SpatialDE
- 用于检测空间差异基因。
SPARK（Spatial PAttern Recognition via Kernels）
- 识别基因的空间模式。
Scanpy
- 适用于大规模空间转录组数据分析。

6. 空间转录组的挑战与未来发展

(1) 主要挑战

空间分辨率限制
- 目前大多数方法的分辨率仍有限，难以达到单细胞水平（除MERFISH、seqFISH等）。
数据分析复杂
- 需要结合空间信息、基因表达、解剖学知识等进行综合分析。
成本较高
- 高通量测序和实验成本仍然较高，限制了其广泛应用。

(2) 未来发展趋势

提高空间分辨率
- 发展更高分辨率的捕获芯片和原位测序技术，实现单细胞甚至亚细胞水平的分析。
多组学整合
- 结合空间蛋白组、表观组学等多维度信息，解析更完整的生物学网络。
AI与计算优化
- 采用机器学习和深度学习优化空间转录组数据的分析方法，提高预测准确性。

7. 结论

空间转录组技术为生命科学研究提供了一种全新的视角，使得科学家能够在空间维度解析基因表达模式。随着技术的不断进步，空间转录组将会在基础研究、临床应用和精准医学中发挥越来越重要的作用。

以下是一个空间转录组（Spatial Transcriptomics, ST） 数据分析代码流程示例，主要基于 10x Genomics Visium 平台，并使用 Seurat 和 SpatialExperiment 进行分析。流程涵盖数据导入、预处理、归一化、降维聚类、空间可视化、差异表达分析等步骤。

1. 安装必要的 R 包

在开始分析之前，需要安装以下 R 包：

# 安装 Bioconductor 包管理器if (!requireNamespace("BiocManager", quietly = TRUE))    install.packages("BiocManager")
# 安装所需 R 包BiocManager::install(c("Seurat", "SpatialExperiment", "scater", "spatialLIBD"))
# 其他必要依赖install.packages(c("ggplot2", "patchwork", "dplyr"))

2. 载入数据

10x Visium 的空间转录组数据通常包含：

filtered_feature_bc_matrix/
（基因表达矩阵）
spatial/
（空间定位信息，包括影像）
scalefactors_json.json
（缩放比例信息）

使用 Seurat 加载 Visium 数据：

library(Seurat)library(ggplot2)library(patchwork)
# 读取 Visium 数据data_dir <- "path_to_your_data"  # 修改为实际数据路径st_data <- Load10X_Spatial(data.dir = data_dir)
# 查看数据基本信息print(st_data)

3. 质量控制（QC）

质量控制的目的是去除低质量 spot（空间点），确保数据可靠性。

# 查看原始数据的质控指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)
# 过滤低质量 spotst_data <- subset(st_data, subset = nFeature_Spatial > 200 & nFeature_Spatial < 5000 & percent.mt < 5)
# 重新绘制 QC 指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)

4. 归一化 & 维度缩减

为了去除测序深度的影响，需要对数据进行归一化，并进行 PCA 降维。

# 归一化数据（使用 SCTransform 或 LogNormalize）st_data <- SCTransform(st_data, assay = "Spatial", verbose = FALSE)
# 运行 PCA 降维st_data <- RunPCA(st_data, verbose = FALSE)
# 查看 PCA 结果ElbowPlot(st_data)

5. 空间聚类分析

在降维的基础上，进行聚类分析，识别组织中的不同区域。

# 计算最近邻st_data <- FindNeighbors(st_data, dims = 1:10)
# 进行聚类st_data <- FindClusters(st_data, resolution = 0.5)
# 运行 UMAPst_data <- RunUMAP(st_data, dims = 1:10)
# 绘制聚类结果DimPlot(st_data, reduction = "umap", group.by = "seurat_clusters")

6. 空间可视化

利用 SpatialFeaturePlot 和 SpatialDimPlot 进行可视化，探索基因在组织中的表达模式。

# 可视化聚类结果SpatialDimPlot(st_data, label = TRUE, label.size = 3)
# 可视化某些基因的空间表达情况SpatialFeaturePlot(st_data, features = c("GFAP", "MBP", "PDGFRA"))

7. 差异表达分析

计算不同组织区域之间的差异表达基因（DEGs）。

# 选择某一聚类进行差异表达分析cluster_markers <- FindMarkers(st_data, ident.1 = 0, ident.2 = 1, min.pct = 0.25)
# 显示前 10 个差异基因head(cluster_markers, 10)
# 可视化某些基因的表达VlnPlot(st_data, features = c("GFAP", "MBP"), group.by = "seurat_clusters")

8. 结合单细胞数据进行空间注释

如果有单细胞数据（scRNA-seq），可以整合到空间转录组数据中。

library(SingleCellExperiment)
# 加载单细胞数据sce <- readRDS("path_to_single_cell_data.rds")
# 识别细胞类型标志基因cell_markers <- FindAllMarkers(sce)
# 映射到空间数据st_data <- AddModuleScore(st_data, features = list(cell_markers$gene), name = "CellType")
# 进行可视化SpatialFeaturePlot(st_data, features = "CellType1")

9. 其他空间分析

(1) 组织区域分割

library(spatialLIBD)
# 计算空间特征spatial_clusters <- spatialLIBD::layer_stat(st_data)
# 可视化plot_layer_diagnostics(spatial_clusters)

(2) 空间相关性分析

library(SpatialExperiment)
# 计算空间自相关性spatial_correlation <- cor(st_data@assays$Spatial@data)
# 可视化相关性矩阵pheatmap::pheatmap(spatial_correlation)

10. 结果导出

将分析结果保存，供后续使用。

# 保存 Seurat 对象saveRDS(st_data, file = "st_analysis_results.rds")
# 导出差异表达基因write.csv(cluster_markers, file = "DEG_results.csv", row.names = TRUE)

总结

以上代码提供了一个完整的空间转录组（ST）数据分析流程，涵盖：

数据加载
质量控制
归一化 & 降维
空间聚类
空间可视化
差异表达分析
结合单细胞数据
空间相关性分析
结果导出

这一流程可以根据具体的实验需求进行优化，比如更换不同的归一化方法（SCTransform 或 LogNormalize）、调整聚类分辨率、或者采用 SPARK-X 进行空间模式识别。

生信大白记第56记，就到这里，关注我！

下一记，持续更新学习生物信息学的内容！

生信大白记邮箱账号：shengxindabaiji@163.com

生信大白记简书账号：生信大白记

生信大白记CSDN账号：生信大白记

生信大白记微信公众号：生信大白记

加入生信大白记交流群938339543

本文章已经生成可运行项目

标签

#空间转录组分析 #生物信息学 #big data #大数据

空间转录组

空间转录组

1. 空间转录组简介

2. 空间转录组的技术原理

3. 主要空间转录组技术

(1) 基于原位测序和荧光杂交的技术

(2) 基于捕获测序的技术

4. 空间转录组的应用

(1) 肿瘤微环境研究

(2) 组织发育与再生研究

(3) 神经科学研究

(4) 免疫系统研究

5. 空间转录组数据分析

(1) 主要分析流程

(2) 主要分析工具

6. 空间转录组的挑战与未来发展

(1) 主要挑战

(2) 未来发展趋势

7. 结论

1. 安装必要的 R 包

2. 载入数据

3. 质量控制（QC）

4. 归一化 & 维度缩减

5. 空间聚类分析

6. 空间可视化

7. 差异表达分析

8. 结合单细胞数据进行空间注释

9. 其他空间分析

(1) 组织区域分割​​​​​​​

(2) 空间相关性分析​​​​​​​

10. 结果导出

总结

(1) 组织区域分割

(2) 空间相关性分析