MAGMA软件被设计用于基于基因的(gene-based)或基因集的(gene-set-based)的关联分析,可以直接找到与目的性状相关的功能基因或功能模块(如基因调控通路等),也有利于发现由多个微效 SNP 关联的基因。
MAGMA 的输入数据可以是原始的基因型数据,也可以是其它关联分析软件的结果(如emmax、gemma等)。
本文用 emmax 的关联分析结果作为输入文件,因为 MAGMA 虽然可以用原始数据进行单位点的关联分析,但是它的运行速度没有 emmax 快。
1. SNP 注释
MAGMA 需要一个 SNP 注释信息文件,内容包括 SNP 位于基因的什么位置。
~/tools/magma --annotate nonhuman window=3,1.5 --snp-loc snp_hardfiltered_biallelic_maf5_ms50_chr_imputated.bim --gene-loc gene_locations.txt --out magma_annotation
- –snp-loc:SNP位置文件,可以用plink的.bim文件,或者文本格式为:
| SNPid | chr | pos |
|---|
- –gene-loc:文本格式为:
| geneID | chr | start | end | +/- | symbol |
|---|

本文介绍了如何使用MAGMA软件进行基因和基因集的关联分析,包括SNP注释、基于基因的GWAS以及基因集分析的步骤,并提供了遇到的‘GLIBCXX_3.4.20’not found问题的解决方法,即检查系统中的libstdc++.so.6版本并更新或通过conda安装高版本。
945

被折叠的 条评论
为什么被折叠?



