空间转录组

该文章已生成可运行项目,

空间转录组

图片

1. 空间转录组简介

空间转录组(Spatial Transcriptomics, ST)是一种结合空间信息和基因表达信息的技术,能够在组织切片上解析基因表达的空间分布模式。这一技术克服了传统单细胞转录组(scRNA-seq)失去空间信息的局限,使得科学家可以在组织结构背景下研究基因表达的变化。

2. 空间转录组的技术原理

空间转录组技术的核心在于:

  • 通过特定方法固定组织切片,并保持mRNA在原位。

  • 利用特殊的空间定位标记(如条形码、荧光探针等)进行mRNA捕获或标记。

  • 通过高通量测序获取mRNA序列信息,并结合空间条形码将基因表达信息映射回原始组织位置。

  • 结合生物信息学分析,重建空间基因表达图谱。

3. 主要空间转录组技术

目前,空间转录组技术可以分为两大类:

(1) 基于原位测序和荧光杂交的技术
  • MERFISH(Multiplexed Error-Robust Fluorescence In Situ Hybridization)

    • 通过荧光原位杂交(FISH)标记RNA分子,并结合条形码编码,实现高通量基因检测。

    • 适用于已知基因集合的空间表达分析。

  • seqFISH+(Sequential Fluorescence In Situ Hybridization)

    • 通过多轮荧光原位杂交(FISH),能同时检测数千种转录本的空间分布。

  • STARmap(Spatially Resolved Transcript Amplicon Readout Mapping)

    • 采用水凝胶固定RNA,并利用空间编码的扩增探针进行测序。

    • 可用于3D组织样本的基因表达分析。

(2) 基于捕获测序的技术
  • Visium(10x Genomics)

    • 采用玻片芯片技术,在组织切片下方铺设含有条形码的捕获探针,通过高通量测序解析mRNA的空间信息。

  • Slide-seq

    • 采用微珠阵列,每个微珠都带有唯一的空间条形码,可用于小鼠大脑等复杂组织的研究。

  • HDST(High-Definition Spatial Transcriptomics)

    • 采用超高密度的空间捕获阵列,分辨率比Visium更高。

  • Stereo-seq(Spatial Enhanced Resolution Omics Sequencing)

    • 由华大基因开发,利用DNA纳米球(DNB)技术实现超高分辨率的空间转录组测序。

4. 空间转录组的应用
(1) 肿瘤微环境研究
  • 解析肿瘤组织中不同细胞类型的空间分布,如免疫细胞、肿瘤细胞、成纤维细胞等。

  • 研究肿瘤异质性及不同区域的基因表达模式,识别潜在治疗靶点。

(2) 组织发育与再生研究
  • 研究胚胎发育过程中基因表达的时空动态变化。

  • 分析再生组织中不同细胞类型的重塑过程。

(3) 神经科学研究
  • 解析大脑皮层、海马等区域的基因表达图谱,研究神经元的功能分区。

  • 结合单细胞转录组研究阿尔茨海默病等神经退行性疾病的病理机制。

(4) 免疫系统研究
  • 研究淋巴结、脾脏等免疫器官中免疫细胞的空间分布。

  • 解析感染性疾病或自身免疫疾病的空间免疫反应。

5. 空间转录组数据分析
(1) 主要分析流程
  1. 原始数据处理

    • 质控:去除低质量的测序数据和背景噪声。

    • 空间定位:将测序数据映射到组织切片的物理坐标。

  2. 归一化和降维

    • 进行数据归一化(如log-normalization)。

    • 采用PCA、t-SNE或UMAP等方法进行降维分析。

  3. 细胞类型鉴定

    • 通过已知的细胞标志基因(marker genes)注释细胞类型。

    • 结合单细胞转录组数据进行整合分析。

  4. 空间差异基因分析

    • 识别不同区域的差异基因表达情况。

    • 分析基因共表达网络,探索调控机制。

  5. 空间组织亚区分割

    • 采用聚类算法(如K-means、Louvain)识别组织中的功能区域。

    • 结合解剖学信息进行功能解析。

  6. 通路富集分析

    • 采用GO(Gene Ontology)、KEGG(Kyoto Encyclopedia of Genes and Genomes)等数据库分析基因功能。

(2) 主要分析工具
  • Seurat
    • 适用于Visium等数据的空间基因表达分析。

  • SpatialDE
    • 用于检测空间差异基因。

  • SPARK(Spatial PAttern Recognition via Kernels)
    • 识别基因的空间模式。

  • Scanpy
    • 适用于大规模空间转录组数据分析。

6. 空间转录组的挑战与未来发展
(1) 主要挑战
  • 空间分辨率限制
    • 目前大多数方法的分辨率仍有限,难以达到单细胞水平(除MERFISH、seqFISH等)。

  • 数据分析复杂
    • 需要结合空间信息、基因表达、解剖学知识等进行综合分析。

  • 成本较高
    • 高通量测序和实验成本仍然较高,限制了其广泛应用。

(2) 未来发展趋势
  • 提高空间分辨率
    • 发展更高分辨率的捕获芯片和原位测序技术,实现单细胞甚至亚细胞水平的分析。

  • 多组学整合
    • 结合空间蛋白组、表观组学等多维度信息,解析更完整的生物学网络。

  • AI与计算优化
    • 采用机器学习和深度学习优化空间转录组数据的分析方法,提高预测准确性。

7. 结论

空间转录组技术为生命科学研究提供了一种全新的视角,使得科学家能够在空间维度解析基因表达模式。随着技术的不断进步,空间转录组将会在基础研究、临床应用和精准医学中发挥越来越重要的作用。

以下是一个空间转录组(Spatial Transcriptomics, ST) 数据分析代码流程示例,主要基于 10x Genomics Visium 平台,并使用 Seurat 和 SpatialExperiment 进行分析。流程涵盖数据导入、预处理、归一化、降维聚类、空间可视化、差异表达分析等步骤。


1. 安装必要的 R 包

在开始分析之前,需要安装以下 R 包:

# 安装 Bioconductor 包管理器if (!requireNamespace("BiocManager", quietly = TRUE))    install.packages("BiocManager")
# 安装所需 R 包BiocManager::install(c("Seurat", "SpatialExperiment", "scater", "spatialLIBD"))
# 其他必要依赖install.packages(c("ggplot2", "patchwork", "dplyr"))


2. 载入数据

10x Visium 的空间转录组数据通常包含:

  • filtered_feature_bc_matrix/

    (基因表达矩阵)

  • spatial/

    (空间定位信息,包括影像)

  • scalefactors_json.json

    (缩放比例信息)

使用 Seurat 加载 Visium 数据:​​​​​​​

library(Seurat)library(ggplot2)library(patchwork)
# 读取 Visium 数据data_dir <- "path_to_your_data"  # 修改为实际数据路径st_data <- Load10X_Spatial(data.dir = data_dir)
# 查看数据基本信息print(st_data)


 


3. 质量控制(QC)

质量控制的目的是去除低质量 spot(空间点),确保数据可靠性。​​​​​​​

# 查看原始数据的质控指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)
# 过滤低质量 spotst_data <- subset(st_data, subset = nFeature_Spatial > 200 & nFeature_Spatial < 5000 & percent.mt < 5)
# 重新绘制 QC 指标VlnPlot(st_data, features = c("nFeature_Spatial", "nCount_Spatial", "percent.mt"), ncol = 3)


 


4. 归一化 & 维度缩减

为了去除测序深度的影响,需要对数据进行归一化,并进行 PCA 降维。​​​​​​​

# 归一化数据(使用 SCTransform 或 LogNormalize)st_data <- SCTransform(st_data, assay = "Spatial", verbose = FALSE)
# 运行 PCA 降维st_data <- RunPCA(st_data, verbose = FALSE)
# 查看 PCA 结果ElbowPlot(st_data)


 


5. 空间聚类分析

在降维的基础上,进行聚类分析,识别组织中的不同区域。​​​​​​​

# 计算最近邻st_data <- FindNeighbors(st_data, dims = 1:10)
# 进行聚类st_data <- FindClusters(st_data, resolution = 0.5)
# 运行 UMAPst_data <- RunUMAP(st_data, dims = 1:10)
# 绘制聚类结果DimPlot(st_data, reduction = "umap", group.by = "seurat_clusters")


 


6. 空间可视化

利用 SpatialFeaturePlot 和 SpatialDimPlot 进行可视化,探索基因在组织中的表达模式。​​​​​​​

# 可视化聚类结果SpatialDimPlot(st_data, label = TRUE, label.size = 3)
# 可视化某些基因的空间表达情况SpatialFeaturePlot(st_data, features = c("GFAP", "MBP", "PDGFRA"))


 


7. 差异表达分析

计算不同组织区域之间的差异表达基因(DEGs)。​​​​​​​

# 选择某一聚类进行差异表达分析cluster_markers <- FindMarkers(st_data, ident.1 = 0, ident.2 = 1, min.pct = 0.25)
# 显示前 10 个差异基因head(cluster_markers, 10)
# 可视化某些基因的表达VlnPlot(st_data, features = c("GFAP", "MBP"), group.by = "seurat_clusters")


 


8. 结合单细胞数据进行空间注释

如果有单细胞数据(scRNA-seq),可以整合到空间转录组数据中。​​​​​​​

library(SingleCellExperiment)
# 加载单细胞数据sce <- readRDS("path_to_single_cell_data.rds")
# 识别细胞类型标志基因cell_markers <- FindAllMarkers(sce)
# 映射到空间数据st_data <- AddModuleScore(st_data, features = list(cell_markers$gene), name = "CellType")
# 进行可视化SpatialFeaturePlot(st_data, features = "CellType1")


 


9. 其他空间分析

(1) 组织区域分割​​​​​​​

library(spatialLIBD)
# 计算空间特征spatial_clusters <- spatialLIBD::layer_stat(st_data)
# 可视化plot_layer_diagnostics(spatial_clusters)


 

(2) 空间相关性分析​​​​​​​

library(SpatialExperiment)
# 计算空间自相关性spatial_correlation <- cor(st_data@assays$Spatial@data)
# 可视化相关性矩阵pheatmap::pheatmap(spatial_correlation)


 


10. 结果导出

将分析结果保存,供后续使用。​​​​​​​

# 保存 Seurat 对象saveRDS(st_data, file = "st_analysis_results.rds")
# 导出差异表达基因write.csv(cluster_markers, file = "DEG_results.csv", row.names = TRUE)


总结

以上代码提供了一个完整的空间转录组(ST)数据分析流程,涵盖:

  • 数据加载
  • 质量控制
  • 归一化 & 降维
  • 空间聚类
  • 空间可视化
  • 差异表达分析
  • 结合单细胞数据
  • 空间相关性分析
  • 结果导出

这一流程可以根据具体的实验需求进行优化,比如更换不同的归一化方法(SCTransform 或 LogNormalize)、调整聚类分辨率、或者采用 SPARK-X 进行空间模式识别。

生信大白记第56记,就到这里,关注我!

下一记,持续更新学习生物信息学的内容!

生信大白记邮箱账号:shengxindabaiji@163.com

生信大白记简书账号:生信大白记

生信大白记CSDN账号:生信大白记

生信大白记微信公众号:生信大白记

加入生信大白记交流群938339543

本文章已经生成可运行项目
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值