生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

GO功能富集分析

GO功能富集分析

这一篇文章我们就要向大家讲解GO的功能富集分析,在进行GO功能富集分析之前,我们先要对前面得到的靶基因的名字进行id的转换。
我们把我们上一篇文章中筛选好的一个共表达结果文件打开,将其中的基因名字以及cor值拷贝出来,放到一个txt文件中。





拷贝完成后,我们就可以通过事先准备好的R语言脚本对symbol.txt文件进行id的转换。最后我们就可以得到转换后的文件。


接下来就可以进行我们GO的功能富集分析了

我们先来看一下GO富集分析的结果,通过富集分析,我们可以得到这样的两个图形
 

这两个图形一个是柱状图,另外一个气泡图,这个柱状图和气泡图很相似,我们先看一下柱状图,它的横坐标是富集在每个功能上基因的数目,纵坐标是功能的名称。像这个柱状图的话,这里不同的颜色代表不同的富集的程度,颜色越红的话富集程度越高。
再看一下这个气泡图,同样这个气泡图也是如此,颜色代表着富集程度,只不过它相对于柱状图来说多了一个基因的比例,这里每个功能上基因的数目除以总的基因的数目会得到的一个比例,横坐标就显示了基因的比例。
 
然后我们来绘制这样两个图形,通过我们id转换后得到的文件和脚本文件。打开R运行脚本文件,我们就可以得到着两个图形,同时还有一个GO富集的结果文件。



但是得到的结果文件里面包含的是基因的id,这样可读性很差,所以我们可以通过一个pl脚本将基因的id转换成名字,这样得到的结果文件可读性就很高,可以用于发表文章。

就此GO的功能富集分析就完成了


课程链接:
TCGA数据库批量挖掘lncRNA视频

相关课程:
长非编码RNA芯片数据挖掘视频


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码