生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

单基因批量筛选之ROC过滤和临床相关性过滤

单基因批量筛选方法之生存分析过滤


单基因批量筛选方法之独立预后分析过滤

ROC过滤

今天继续给大家介绍单基因批量筛选的方法,前面我们给大家介绍了生存分析过滤和独立预后分析过滤,接下来做ROC曲线过滤,在分析的时候,ROC曲线被经常用到,而且一个好的AUC值是ROC曲线是否可用的先决条件,所以找到那些符合AUC值的基因,是绕不过的过滤分析。

AUC值大于0.7作为我们的筛选条件,ROC曲线的意义在于,当某个基因的ROC曲线的AUC值大于0.7,说明通过该基因去预测病人的生存的准确性是比较高的。
这里用到的输入文件就是前面做独立预后分析过滤得到的基因文件,用到的R包是“survivalROC”R包。
得到的结果文件,一个是ROC值得文件,一个文件时导出符合条件得基因矩阵,用于做接下来得过滤分析。
 

临床相关性过滤

经过前面得分析,我们得到得基因是跟生存相关,并且可以作为独立预后因子,而且这些基因用于预测生存得准确性是比较高得,接下来要做得临床相关性过滤,找到跟临床相关得基因,用于后面基因得直接筛选。
结果解读:

第一列是基因,第二列到倒数第二列是该基因与各临床相关性得P值,最后一列是与临床相关个数得统计,比如第一个基因,它与八个临床相关性得P值都小于0.05,这样得操作非常高效,而且是基于所有数据库做分析,为后面挖掘数据提供便捷的参考。
当然我们在后面筛选基因时,不一定要看临床相关性过滤的总数,有些不那么相关的临床我们可以不在讨论范围内,所以得到这个结果表格,就有很多选择,结合文献,挑选自己感兴趣的基因做后续单基因挖掘。
那么用这个结果表格里面的基因做分析,后面的生存分析,独立预后分析,ROC曲线,临床性相关性分析的图表都是比较美观的,因为这些基因时通过4层过滤得到的基因。

购买这个课程

生信自学课堂精品课程推荐:
《自噬基因预后模型文章套路》
免疫基因预后模型5分文章套路
《TCGA免疫细胞浸润模式挖掘》
《TCGA肿瘤微环境》
《TCGA肿瘤突变负荷》
《单基因文章套路基于TCGA数据库》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码