使用Seurat包读取10XGenomics数据时出现了报错
> test <- Read10X(data.dir = "../../GSE176078/CID3946")
Error in `[.data.frame`(feature.names, , gene.column) : 选择了未定义的列
使用?Read10X查看函数参数,发现

gene.column的默认值是2。同时,对比报错的文件(如下左图)和读取正常的示例文件(如下右图),报错文件中只有一列gene symbol。而示例文件中一共有两列,分别是Ensembl ID和gene symbol。Read10X读取时,取gene symbol,所以默认值是2。

所以,修改默认值gene.column = 1就可以了
> test <- Read10X(data.dir = "../../GSE176078/CID4465",gene.column = 1)
> class(test)
[1] "dgCMatrix"
attr(,"package")
[1] "Matrix"
> test[1:5,1:5]
5 x 5 sparse Matrix of class "dgCMatrix"
CID4465_AAACGGGTCATCGATG CID4465_AAACGGGTCGGAAACG CID4465_AAAGATGAGGTGTGGT CID4465_AAAGCAATCCTTTACA CID4465_AACCATGGTACGCTGC
RP11-34P13.7 . . . . .
FO538757.3 . . . . .
FO538757.2 . 1 . . .
AP006222.2 . . . . .
RP4-669L17.10 . . . . .
2万+

被折叠的 条评论
为什么被折叠?



