生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

METABRIC数据库挖掘ROC曲线过滤和临床相关性过滤

ROC曲线过滤和临床相关性过滤

1、ROC曲线过滤
通过ROC曲线我们可以得到基因预测病人生存的一个准确性,也就是说我们会治好了ROC之后我们就可以看一下他曲线下的面积,也就是AUC值,如果AUC值大于0.7的话就说明,用我们选择的基因去预测病人的生存期,它的准确性是比较高的,所以我们就会做一个ROC曲线的过滤,我们就会得到这样的表格,这个表格第一列就是基因的名称,第二列就是这个曲线下的面积,也就是AUC值。我们这里过滤就按照0.7作为一个过滤的标准,如果我们的ROC曲线下的面积大于0.7的话,我们就把这个基因保留下来,如果这个值小于0.7的话,我们就把这个基因删掉。

接下来是具体操作,我们要用到的输入文件是之前得到的独立预后分析显著相关的基因表达量文件以及我们生信自学网写好的脚本文件。
 
在R中运行我们的脚本文件,我们就可以得到ROC过滤后的结果文件,还有我们ROC显著基因的表达量文件。


2、临床相关性过滤
得到ROC显著基因的表达量之后,我们就可以进行临床相关性的过滤,我们会得到这样一个表格,他的行名是基因的名称,列名就是临床性状。这里面的值就是基因和临床性状他们相关性的一个P值,如果批小于0.05就说明这个基因跟他的相对应的临床性状是显著相关的,最后一列显示与这个基因显著相关的临床性状的具体数目。
 
接下来进行具体操作,需要的输入文件就是我们刚刚得到的ROC显著基因的表达量文件,以及我们之前得到的clinical.xlsx临床文件,还有执行操作的脚本文件。准备好了这些文件后,我们就可以进行过滤操作了,在配置好脚本文件的执行目录之后,用R运行我们的脚本。就可以得到过滤之后的文件





(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码