生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

绘制ROC曲线以及计算C-index值

ROC曲线以及计算C-index值

这一篇文章我们向大家讲解一下ROC曲线的绘制和C-index值的计算,我们先来绘制ROC曲线。
        我们先看一下绘制ROC曲线需要的输入文件risk.txt,这个文件内容从左往右依次是病人的id,生存时间,生存状态,两个长非编码RNA的表达量,风险值,风险值的评估。

        除了这个文件以外,我们还需要绘制ROC曲线图的脚本,脚本的话是由我们生信自学网提供。
        运行完脚本文件后我们就可以得到ROC曲线的图形:

         我们来看一下这个图形,它的横坐标就是假阳性率,它的纵坐标是真阳性率,我们画这个曲线是目的,就是要看这个红线下的面积,如果这个面积达到0.7以上,也就是AUC值达到0.7以上,就说明我们这个模型的准确性还不错。大多数发表的文章也是在0.7以上,如果面积能达到0.9以上,那么就说明我们这个模型非常准确了。

C-index值

        讲解完了如何绘制ROC曲线后,接下来我们要向大家讲解一下C-index值,C-index的话也叫一致性指数,这个就和AUC值很相似。这个值它是主要用于计算生存分析中COX模型预测值与真实值之间的区分度。
        也就是说,我们做了一个模型,但是这个模型我们要怎么去评价这个模型的好坏呢?我们可以根据前面做的ROC曲线得到的AUC值,如果它大于0.7的话就说明我们的模型还可以。另外的话我们就可以用到这个一致性指数C-index值。这个值我们也可以用于判断我们的模型是否准确。
        现在在很多文章里面,有的文章会用到AUC值,有的文章会用到C-index值,所以这样我们这里讲解一下怎么去计算这个C-index值。
        输入文件的话和上面的输入文件是一样的,脚本文件的话同样也是由我们编写而成的。
        运行脚本,我们可以得到C-index的值,还有C-index的一个波动范围,还有95%CI的高低值和Pvlaue值。


课程链接:
TCGA数据库批量挖掘lncRNA视频

相关课程:
长非编码RNA芯片数据挖掘视频


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码