METABRIC数据库挖掘ROC曲线的绘制
时间:2020-07-18 来源:生信自学网 作者:刘鑫
微信公众号:biowolf_cn 点击:次
绘制ROC曲线在绘制ROC曲线之前,我们首先要知道做绘制ROC曲线的目的是什么。通过ROC曲线,我们可以得到这个基因预测病人生存的准确性。我们挑选好了一个基因,我们想知道这个基因去预测病人的生存的准确性如何,我们就可以通过这个ROC曲线进行实现,绘制好ROC曲线,我们主要看的就是曲线下的面积,如果这个曲线下的面积大于0.7,就说明我们选择的基因去预测病人的生存,它的准确性是比较高的。ROC曲线的横坐标是假阳性率,纵坐标是真阳性率,然后我们根据不同的年限可以绘制不同的ROC曲线。比如下面的图里面,红色代表的是五年的ROC曲线,绿色代表三年的ROC曲线,蓝色的话是代表一年的ROC曲线。每条曲线下的面积我们都会用AUC值表示,一年的AUC值是0.708,三年的话是0.679,五年的话是0.631,这就是它的曲线下的面积。要绘制ROC曲线,我们需要准备的是之前得到的单基因的数据文件,我们先看一下输入文件,它的第一列是药品的名称,第二列是生存时间,单位是年,第三列就是生存状态,1代表这个病人已经死亡了,0代表这个病人还存活,接下来就是基因的表达量以及各种临床性状。在这里,我们只需要用到三列信息,也就是生存时间,生存状态和基因的表达量。然后就是脚本文件。脚本文件由我们生信自学网提供,有兴趣的学员可以通过文章末尾的联系方式联系我们购买相关的视频学习。 接下来我们运行我们脚本,复制脚本里的内容,粘贴到R中运行,等待运行完成,我们就可以得到我们ROC曲线的图形。 (责任编辑:伏泽 微信:18520221056) |