生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

METABRIC数据库挖掘临床相关性分析

临床相关性分析

1、临床相关性分析输入文件的准备
接下来我们要进行临床相关性分析。在分析之前,我们需要准备好临床相关性分析需要的输入文件,我们首先需要有我们基因的表达量,因为我们挑选好了基因之后,我们想要做我们挑选的基因跟其他临床性状的相关性,所以如下表格里面必须有我们基因的表达量,还有各种遗传性状,所以我们需要准备好这样一个输入文件,在做临床相关性分析的时候,我们会对这个表格进行调整。把这个表格作为一个输入文件。

接下来我们要准备好输入文件,首先我们需要基因的表达量,就是之前我们得到的ROC显著性的基因的表达文件。然后我们需要的另外一个文件就是clinical.txt文件,最后还有我们的脚本文件,用来将我们的输入文件进行合并。

复制脚本文件的内容,在R中运行我们的脚本文件,就可以得到合并后的文件,也就是我们做临床相关性分析的输入文件。

2、临床相关性分析
准备好临床相关性分析需要的输入文件后,我们就可以进行临床相关性分析。
上面已经得到了输入文件,只要在R中运行临床相关性分析的脚本,我们就可以得到这样的图形,我们先来看一下第一张图,第一张图它的横坐标是年龄,纵坐标是基因的表达量。我们根据这个病人的年龄,我们可以将病人分为两组,将小于等于60岁的分为一组,大于60岁的分为一组,然后我们就可以比较两组之间基因的表达是否具有差异。我们可以看到这个P值是小于0.01的,说明这个两组之间,它的基因的表达是具有差异的,同时我们可以看到小于等于60岁这一组,它的中位值要高于大于60岁的这一组,所以我们就可以得到这样的结论,这个基因在小于等于60岁的这一组里面,它的表达是更高的。
接下来我们看第二个图,这个图的横坐标就是ER的状态,我们也可以把它分为两组,也就是ER阳性组和ER的阴性组。这里纵坐标也是基因的表达,我们可以看到这两组之间差异也是非常显著的,它的P也是小于0.001的,然后我们也可以很明显的看出,在这个阴性组里面,它的表达是要明显高于阳性组,我们就可以得到这样的相关性的结果。








(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码