生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > GEO >

GSEA富集分析

1.     进入官网下载GSEA,可以下载下载桌面板,也可以用java版更小更方便啦。
http://software.broadinstitute.org/gsea/downloads.jsp

2、把下载的GSEA安装号,就进入软件的界面。

3、准备文件。
一定要看清我文件后缀

a. 第一个文件在官网网站下载,也可不下。

b. 第二个文件是差异分析的基因,格式如下。

#1.2照写

19668是分析的差异基因总数,611是样本总数

Description是对gene的描述,因为有的学员拿回来的gene是探针名,这时候就可以在第二列写你的gene symbol,我因为去掉了探针名,所以就写的NA喽,GSEA格式就是这么要求的。
c. 第三个文件格式如下:

611是样本数,2是分组,1是啥我也不知道,嘿嘿。

第2行是组名,我做的肿瘤就分为normal和tumor,可以自行更换。

第三行是样本名,每一个样本在什么组,有多少就写多少,我写了611个。

4、进入GSEA。

将文件全部导入,有错误这一步就会报错,根据提示修改即可。

5、点击Run GSEA.

第一个选项是基因表达矩阵文件。

第二个就是官网下载的文件,这里看个人喜好,可以做KEGG,GO什么的,也可以在这里下载其他的功能注释数据库。
第三个就是自己选了,normal可在前在后。
6、探针转换基因名,我自带名称,选择的否。
如果选择True,下面的platform就要选一个注释的数据库,一般好像选第一个好像,我没试过,小伙伴们可以多尝试几个数据库。

7、 运行得到的结果。


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码