生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

单基因批量筛选方法之生存分析过滤

单基因筛选过滤,层层筛选,层层过滤,用数据库本身数据,得到最佳理想效果的基因。

1、生存数据和表达数据合并
这里我们用到两个文件,一个是临床数据文件,一个是表达文件,根据样本代号,可以把两个文件合并起来,合并的方法很简单,生信自学网这里使用perl脚本,运行之后直接出结果,简单又高效。

2、得到合并后的矩阵expTime.txt,我们开始做第一个筛选:生存分析过滤
这里我们会用到两种方法,一种是KM的方法,一种是Cox的方法。
KM方法是离散的方法,根据基因表达量中位值,把样本分成高低表达两组,比较两组之间是否存在差异,这是一个离散的比较,比较两组是否有生存差异。
Cox方法是把基因当成一个连续变量,跟生存时间和生存状态进行比较,看基因表达是否和生存相关。
这里筛选条件,是KM方法和Cox方法同时小于0.001
然后把同时符合条件的基因信息保存下来,做接下来的筛选

第一列就是基因名称, KM方法的p值,后面几列是cox分析的结果,分别是HR值,95% CI以及cox分析的p值,表里面输出的基因都是KM和Cox的p值都小于0.001的结果。
同时输出用于后续分析的一个表格:

生存相关显著的基因矩阵,用于后面的几层筛选使用
后面我们会介绍其他几个步骤

购买这个课程

生信自学课堂精品课程推荐:
《自噬基因预后模型文章套路》
免疫基因预后模型5分文章套路
《TCGA免疫细胞浸润模式挖掘》
《TCGA肿瘤微环境》
《TCGA肿瘤突变负荷》
《单基因文章套路基于TCGA数据库》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码