人类基因统计信息

本文介绍了不同类型的非编码RNA,包括snoRNA、snRNA、rRNA、scRNA、TERC、small ncRNA(miRNA和siRNA)、lncRNA等,并提供了最新的人类miRNA基因和成熟miRNA数量统计,总数分别为3043个和2588个。

以前的统计

项目特征
基因组大小3.2×1093.2\times10^93.2×109 bp
常染色质92%
蛋白质编码序列1.1%~1.4%
RNA编码序列28%
内含子序列24%
基因间序列75%
基因数目2万~2.5万
已知编码蛋白质的基因19438
预测编码蛋白质的基因2188
基因数量最多的染色体chr19
基因数量最少的染色体chr13
基因平均长度2~30kb
编码序列平均长度1.3kb/每个基因
外显子平均总长度1.4kb/每个基因
单个外显子的平均长度145 bp
基因内含子的平均长度3365 bp
5’—UTR平均长度300 bp
3’—UTR平均长度770 bp
已知基因外显子的平均数9.7个/每个基因
预测基因外显子的平均数4.7个/每个基因
外显子最多的基因肌联蛋白基因,234个外显子
AT / GC54% / 38%
SNP出现的频率1/1.3kbp
SNP造成蛋白质变异0.12% ~ 0.17%
重复序列占基因组的比例50%以上
1, 四类寄生的DNA46%
其中,LINE21%
其中,SINE14%
其中,反转录病毒类8%
其中,DNA转座位子3%
2, 大段染色体重复5.3%
3. (A)n,(CA)n,(CCC)n(A)_n,(CA)_n,(CCC)_n(A)n,(CA)n,(CCC)n等重复序列3%
CpG岛占全基因组0.7% (27 000个)
其中,长度小于1 800bp95%
其中,长度小于850bp75%
其中,最长在chr1036619 bp

在这里插入图片描述

最新统计数据

基因总数量
protein-coding genes20412
pseudo-genes14600
total long ncRNA14727
total small ncRNA5037
miRNA1756
rRNA532
snRNA1944
snoRNA1521
misc ncRNA2213

snoRNA : 小核仁RNA
snRNA: 小核RNA
rRNA: 核糖体RNA
scRNA:细胞质小RNA
TERC:端粒酶RNA
small ncRNA: 包括miRNA和siRNA
miRNA: 微小RNA
siRNA:小干扰RNA
lncRNA:长链非编码RNA,包括
,sense lncRNA(同义长非编码)
,antisense lncRNA(反义长非编码RNA)
,intronic lncRNA(内含子长非编码)
,lincRNA(基因间区长非编码RNA)
本人统计:
miRNA基因: 3043个
人类已知成熟的miRNA:2588个(来源于早年的miRBase v21)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值