一、目标与挑战
-
核心目标: 构建一个能处理多平台、多模态空间组学数据,并输出标准化单细胞表达矩阵的通用框架。
-
主要挑战: 不同技术平台数据格式差异大;细胞分割准确性要求高;海量数据计算效率需求迫切。
二、CellBin技术框架深度解析
CellBin的整体工作流程可概括为以下几个核心模块:
-
数据输入与预处理: 支持表达矩阵和组织图像作为输入。
-
关键处理步骤:
-
图像拼接: 采用优化算法,将高通量技术产生的数千张连续切片图像进行高精度配准与拼接,形成完整的组织全景图,消除空间错位。
-
细胞分割: 集成针对不同成像模式(如ssDNA、H&E、荧光)的细胞核或细胞膜信号进行分割的模型,精确识别单个细胞边界。
-
分子归属: 将基因表达分子(UMI)根据其空间坐标归属到分割出的单个细胞中,生成细胞-基因表达矩阵。
-
-
输出: 获得标准化的单细胞空间基因表达谱,用于下游的细胞注释、差异分析、空间互作等分析。
三、性能评估与技术优势
在公开数据集上的评测显示,CellBin在多个关键指标上表现优异。例如,在细胞分割任务中,其F1分数和Dice系数均高于对比方法。其技术优势主要体现在:
-
通用性强: 适配Stereo-seq、Visium HD、Xenium、Stereo-Cell等多种技术产生的数据。
-
精度高: 细胞分割和分子定位准确,为下游分析提供可靠输入。
-
效率优: 优化计算流程,支持大样本处理。
四、在DCS Cloud平台的集成与实践
DCS Cloud 平台已将CellBin作为一项核心分析工具集成。对于开发者而言,这种集成带来了两大便利:
-
开箱即用: 无需手动配置环境依赖,登录平台即可使用。
-
算力保障: 直接利用云端高性能计算资源,轻松应对大规模空间数据集。研究者可以通过平台提供的图形化界面或API调用CellBin,快速将其整合到自己的分析流水线中。
资源链接:
论文链接:
https://doi.org/10.1101/2025.10.23.683357
CellBin github获取链接(论文):
https://github.com/STOmics/cellbin2/tree/paper
CellBin在DCS Cloud上的获取链接:
https://cloud.stomics.tech/#/library
3922

被折叠的 条评论
为什么被折叠?



