生信探索

0
获赞数
3
关注数
0
粉丝数
IP 属地广东
2023-05-24 加入
浏览 857
╭╮╱╭┳━━━┳╮╱╭╮
┃┃╱┃┃╭━╮┃┃╱┃┃
┃╰━╯┃┃┃┃┃╰━╯┃
╰━━╮┃┃┃┃┣━━╮┃
╱╱╱┃┃╰━╯┃╱╱┃┃
个人简介什么都没有
1 声望
暂无数据
黄金勋章
暂未获得该勋章
如何获得
白银勋章
暂未获得该勋章
如何获得
青铜勋章
暂未获得该勋章
如何获得
个人动态
  • 发布了文章2024-09-03
    100个GEO基因表达芯片或转录组数据处理(16) GSE98895 GPL15207
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-09-02
    100个GEO基因表达芯片或转录组数据处理(15) GSE98895 GPL6947
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-08-27
    爬虫:爬取MDPI杂志中国作者单位和邮箱
    Python爬虫,简单来说,就是使用Python编程语言编写的一种自动化获取网页内容的程序。它们能够模拟人类浏览网页的行为,如访问网页、解析网页内容、甚至填写表单和点击链接等,从而帮助我们从互联网上大量收集和处理数据。Python爬虫因其强大的库支持(如requests、B...
  • 发布了文章2024-08-16
    MySQL05: 表合并
    UNION 合并表格的时候,除了拼接之外还会多一个附加动作——去重(以前旧版本还有排序功能,新版本舍弃了排序功能) 去重复就会在数据量大的时候相比UNION ALL慢
  • 发布了文章2024-08-13
    MySQL04: 查询语句
    搞数据分析肯定是要学习下数据库的;本文数据下载可以后台联系入群核心7个关键词SELECT、FROM、 WHERE、GROUP BY、HAVING、ORDER BY、LIMIT {代码...} SELECT、FROM组合查询命令中必须使用的组合,select相当于tidyverse中的select选择列,from是选择的表格的名字 {代...
  • 发布了文章2024-08-12
    MySQL03: 创建表格与导入表格
    (非空、唯一)规定行索引,类似pandas中的index,可以是一列或者多列,但是必须不为NULL且不能有重复值主键在MySQL中的作用至关重要,主要体现在以下几个方面:
  • 发布了文章2024-08-10
    MySQL02: 常用数据类型
    搞数据分析肯定是要学习下数据库的;主要的数据类型,包括字符串、数值、日期时间数值型INT就是整数类型,根据允许的数值大小分为以下类型(由小到大),这样做的目的是节约空间INT类型范围(有符号)范围(有符号)TINYINT(-27, -27-1)(0,2^8-1)SMALLINT(-215, -215-...
  • 发布了文章2024-08-08
    100个GEO基因表达芯片或转录组数据处理GSE166193-GPL16686平台(014)
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-08-04
    100个GEO基因表达芯片或转录组数据处理GSE23317(013)
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-08-03
    100个GEO基因表达芯片或转录组数据处理GSE60542(012)
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-07-31
    100个GEO基因表达芯片或转录组数据处理GSE35570(011)
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-07-30
    100个GEO基因表达芯片或转录组数据处理GSE113865(010)
    虽然现在是高通量测序的时代,但是GEO、ArrayExpress等数据库储存并公开大量的基因表达芯片数据,还是会有大量的需求去处理芯片数据,并且建模或验证自己所研究基因的表达情况,芯片数据的处理也可能是大部分刚学生信的道友入门R语言数据处理的第一次实战,因此准备...
  • 发布了文章2024-07-25
    sklearn决策树可视化
    叶节点:树的末端节点,没有子节点,代表一个类别或者预测结果。叶节点上通常会有“value”或“class”等信息,表示该节点下数据的多数类别或预测的平均值(针对回归任务)。
  • 发布了文章2024-07-24
    使用infercnv对单细胞转录组进行拷贝数变异推断(上,原理)
    InferCNV 是一个专门设计用于鉴定肿瘤样本中拷贝数变异(Copy Number Variations, CNVs)的R包,特别是在单细胞RNA测序(scRNA-seq)数据分析领域。它通过比较肿瘤细胞与正常细胞(或参照细胞)的基因表达水平,推断出肿瘤细胞中的染色体拷贝数变化,如扩增或缺失,...
  • 发布了文章2024-07-23
    综述阅读:鼻咽癌
    鼻咽癌的地理分布具有明显的特点,在东亚和东南亚尤为常见。过去十年的流行病学趋势显示,其发病率逐渐但稳步下降,死亡率也大幅降低。这些发现可能反映了生活方式和环境的变化,对病理和风险因素的增强理解,人群筛查,影像技术的进步,以及个性化的综合放化疗策略...
  • 发布了文章2024-07-20
    CibersortX的替代者BayesPrism用单细胞数据去卷积得到普通转录组细胞类型比例
    CibersortX网站是常用的工具,但是是网页上传数据,现在网页503打不开,而BayesPrism在PMID: 37717006 文章benchmark 9种方法中发现BayesPrism的假阳性与假阴性数量上最低,并且在分解精细的免疫谱系时展现出最佳性能;因此可以作为替代工具,并且BayesPrism也提供了...
  • 发布了文章2023-06-01
    六一双倍的快乐:ggplot2绘制双y轴图
    双y轴图的目的,是想要在同一坐标系中画两组数据,但是他们值范围差很多,比如一组数据是1-10,另一组是10-100,那么可以对第一组数据做数据变化,比如第一组数据乘以 10,然后在对应的y轴上写上1-10,虽然第一组的数据已经变成了10-100。这种数据变换叫做归一化(Nor...
  • 发布了文章2023-05-29
    01.GATK肿瘤基因变异最佳实践SnakeMake流程:WorkFlow简介
    <~生~信~交~流~与~合~作~请~关~注~公~众~号@生信探索>代码地址 {代码...} GATK best practices workflow Pipeline summarySnakeMake workflow for Human Somatic short variants (SNP+INDEL)Expected fastq inputsMatched normal and tumor samples.ReferenceR...
  • 发布了文章2023-05-29
    Julia编程12:文件系统
    <~生~信~交~流~与~合~作~请~关~注~公~众~号@生信探索>查看与切换目录 {代码...} 路径处理路径拼接 {代码...} 绝对路径求一个文件的绝对路径, 当前文件夹下有一个名为pkg.csv的文件 {代码...} basename {代码...} dirname {代码...} 路径标准化删除.. 或. {代码...
  • 发布了文章2023-05-27
    GATK最佳实践之数据预处理SnakeMake流程
    写的数据预处理snakemake流程其实包括在每个单独的分析中比如种系遗传变异和肿瘤变异流程中,这里单独拿出来做演示用,因为数据预处理是通用的,在call变异之前需要处理好数据。数据预处理过程包括,从fastq文件去接头、比对到基因组、去除重复、碱基质量校正,最后...