「来绘图吧！」链特异性测序的read depth绘制

最新推荐文章于 2025-04-19 16:49:47 发布

原创

最新推荐文章于 2025-04-19 16:49:47 发布 · 721 阅读

本文介绍了一种链特异性RNA-Seq测序方法及其分析流程，通过使用dUTP标记并去除含有该标记的序列，实现了对酿酒酵母正负链转录本的精确区分。文章还提供了具体的上游分析代码及下游绘图示例。

以酿酒酵母为例，用到的数据如下，
随便找一个链特异性测序的fastq用常见比对软件跑一下都行。
有一些数据我放在github，可参考：https://github.com/Youpu-Chen/Myscripts/tree/miniproject/mini-project/strand-specific-RNAseq

Saccharomyces cerevisiae的基因组文件
Saccharomyces cerevisiae的链特异性测序数据

上游处理

稍微解释一下为什么要这样做。
普通的RNA-Seq建库测序方式，反转录得到的cDNA，连接上的adaper不具有特异性，只是为了将目标序列连接到oligo上。最终的reads alignment无法区分开比对到某一个区域（包括positive strand和negative strand的一段基因组序列）的reads，来自该区域正负链的真实性。

Note：真实性，指这段区域的正负链真的在转录过程中有表达reads，而不是由于反转录建库而引起的。

而链特异性测序为例（以加入dUTP的方法为例，也是使用最广泛的一种方法）。shortgun得到目标mRNA序列之后，第二轮直接加入dUTP作为标记，之后再把含有这样标记的序列给拿掉。那么上述的操作，就保证了最终基于read alignments的定量结果，能够精确到正负链。

Note：普通的建库测序方法，就相当于放大镜，直接将大家的表达量都乘以2，最后再进行different gene expression。

上游分析代码如下，

# make chromosome bed file
samtools faidx genome.fa
awk '{print $1"\t"$2}' genome.fa.fai > genome.txt

标签

#r语言 #生物信息学

最低0.47元/天解锁文章