生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

METABRIC数据库挖掘多GSEA富集图以及共表达分析

多GSEA富集图以及共表达分析

1、多GSEA富集图
我们将前面的单张的GSEA富集图放在一起,形成如下这样一个图形,它包含十个通路,其中上面五个通路,它们的峰值出现在高表达组,也就是这些通路在我们的基因表达越高的情况下,这些通路越活跃,而另外五个通路,它是出现在我们的低表达组,也就说我们这个基因表达越低,这些通路反而越活跃,就可以得到这样的结论。我们再看一下图形的下半部分,这里都是一个一个的基因,这些基因都已经是排序好了,越靠近左边的基因跟我们的目标基因正相关性越强,而越靠近右边的基因跟我们的基因的负相关性越强。然后我们看一下这个曲线是怎么来的,红色的话也就是这个通路,我们找到红色的曲线,这里跟这里来这里是一一对应的,然后我们我们可以看到这里面的这个线段的话都代表我们红色这个通路上的基因。

接下来我们进行具体操作绘制这样一个图形,我们要准备的输入文件是我们先前得到的GSEA的结果文件夹,在文件夹内找到index.html打开,打开之后我们点击enrichment results in html。在里面找我们需要的通路,点击详情,将文件保存到我们的输入文件夹中。保存好后,在R中运行我们的脚本文件。




这样我们就可以得到我们的多GSEA富集图。

2、共表达分析
共表达分析的目的就是找出与我们的目标基因具有相互作用的基因,通过共表达分析,我们可以得到这样的表格,这个表格的第一列就是我们的目标基因,第二列就是跟我们的目标基因具有共表达关系的基因,第三列就是他们之间的相关系数,接下来就是pvalue,pvalue就是相关性检验的一个P值,这个P越小,就说明我们这两个基因之间具有相关性的可能性越高。当然,得到这样的表格以后,我们还可以对他进行可视化,这个散点图就可以看出他们的相关性。这个图它的横坐标就是我们的目标基因,纵坐标就是跟我们的目标基因具有相关性的基因,他们两个基因,一个作为横坐标,一个作为纵坐标,我们就可以把我们所有样品的点打上去,我们还可以模拟出一个线段,这个线段就代表它的一个趋势。如果从左到右这个线段是往上走的话,就说明他们是一个负相关的关系。


下面我们来进行操作,我们需要的输入文件是我们之前得到的补缺后的文件,和我们的脚本文件。

在R中运行脚本文件,我们就可以得到很多个输出文件,里面有我们的共表达分析的表格和图片。





 


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码