全基因组关联分析(GWAS)软件:gemma

本文介绍了GEMMA(Version 0.94.1)软件的使用。它需要基因型、表型、相关矩阵和协变量(可选)四个主要输入文件,支持特定格式。说明了相关矩阵的计算方法,还提及多变量线性混合模型的关联测试,最后介绍了运行该软件后的两个输出文件及其内容。

版本:Version 0.94.1

输入文件

GEMMA 需要四个主要的输入文件,包括基因型、表型、相关矩阵和协变量(可选)。
基因型和表型文件可以是两种格式,都是 PLINK binary ped 格式或者都 BIMBAM 格式。不可混用。

输入文件

接受比较多的输入类型,这是用的 plink 格式:

GEMMA 识别基因型和表型的 PLINK binary ped 文件格式.
该格式需要三个文件:*.bed, *.bim, *.bam,所有文件都有相同的前缀。
用户可以用 PLINK 将标准 ped 文件转换成 binary ped 文件:
命令:

plink --file [file_prefix] --make-bed --out [bedfile_prefix]

对于 *.fam 文件,GEMMA 仅读取第二列(individual id)和第六列(phenotype).
用户可以定义其它列作为 phenotype 列,使用 ‘-n [num]’ 参数指定要分析的表型,’-n 1’ 使用原始的第六列作为 phenotypes,’-n 2’ 使用第七列,以此类推。
GEMMA 用 0/1 编码等位基因。
*.bim 文件的第 5 列是 minor allele ,编码为 1;第 6 列为 major allele ,编码为 0.
因此,第 5 列的 minor allele 是效应基因。

GEMMA 将按照提供的方式读入表型,’-9‘ 和 ‘NA’ 作为缺失表型。

pink --file ms_0.4_NAU --maf 0.05 --geno 0.2 --recode --make-bed --out snp --noweb
  • snp.bim
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值