单基因筛选过滤,层层筛选,层层过滤,用数据库本身数据,得到最佳理想效果的基因。 1、生存数据和表达数据合并 这里我们用到两个文件,一个是临床数据文件,一个是表达文件,根据样本代号,可以把两个文件合并起来,合并的方法很简单,生信自学网这里使用perl脚本,运行之后直接出结果,简单又高效。 2、得到合并后的矩阵expTime.txt,我们开始做第一个筛选:生存分析过滤 这里我们会用到两种方法,一种是KM的方法,一种是Cox的方法。 KM方法是离散的方法,根据基因表达量中位值,把样本分成高低表达两组,比较两组之间是否存在差异,这是一个离散的比较,比较两组是否有生存差异。 Cox方法是把基因当成一个连续变量,跟生存时间和生存状态进行比较,看基因表达是否和生存相关。 这里筛选条件,是KM方法和Cox方法同时小于0.001 然后把同时符合条件的基因信息保存下来,做接下来的筛选 第一列就是基因名称, KM方法的p值,后面几列是cox分析的结果,分别是HR值,95% CI以及cox分析的p值,表里面输出的基因都是KM和Cox的p值都小于0.001的结果。 同时输出用于后续分析的一个表格: 生存相关显著的基因矩阵,用于后面的几层筛选使用 后面我们会介绍其他几个步骤 购买这个课程生信自学课堂精品课程推荐:《自噬基因预后模型文章套路》 《免疫基因预后模型5分文章套路》 《TCGA免疫细胞浸润模式挖掘》 《TCGA肿瘤微环境》 《TCGA肿瘤突变负荷》 《单基因文章套路基于TCGA数据库》 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |