生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > GEO >

如何结合GEO和TCGA快速发文癌症甲基化

又到致青春的毕业季,论文写好了吗?实验还顺利吗?生信挖掘还有疑惑吗?

上一期推荐给大家学习的课程,大家都学习的如何,甲基化分析大家掌握了多少,是否已经找到了写文思路,发文突破口。

数据库总是偏爱做癌症分析的同学,左有TCGA,右有SEER数据库,中间还有一个GEO可以挖掘,真是让人倍感羡慕。

可以说在TCGA登上舞台中央之时,也是GEO风华将逝之际,但是将还是老的辣,盘踞舞台这么多年,GEO所能发挥的作用是巨大的,特别是当把GEO和TCGA两大数据库结合分析的时候,GEO就能焕发新的活力。

 

今天给大家推荐一个分析思路,是在GEO分析基础上,结合TCGA数据库验证,让分析数据更加具有说服力,也让审稿人眼前一亮。
GEO甲基化分析

思路是这样的:

 

1、利用GEO数据库挖掘4个芯片,2个基因芯片2个甲基化芯片,分别做差异分析,2个基因芯片分别得到高、低表达基因,2个甲基化芯片分别得到高、低甲基化,然后注释得到对应的基因;(这一步可以学习《GEO芯片分析》《GEO甲基化分析》
甲基化分析
2、4个芯片的高表达基因和低甲基化对应的基因做交集,得到高表达低甲基化基因;2个芯片的低表达基因和高甲基化对应的基因做交集,得到低表达高甲基化基因;
甲基化分析
3、步骤2的两类基因分别做GO、KEGG、PPI网络构建,在PPI网络构建之后利用包做核心网络,核心网络再做KEGG富集分析,得到很多数据和图片;(这一步可以学习《GO富集分析》、《KEGG富集分析》《共表达分析》《Cytoscape软件操作》
富集分析
PPI网络构建
4、这一步是本文的重点,也是难点,看似简单的一张验证表,确需要做大量的分析,不仅需要从TCGA下载表达数据,还需要做TCGA的甲基化分析。就是从TCGA数据库做基因的差异分析和甲基化的差异分析,分别与前面得到的高表达低甲基化、低表达高甲基化做交集,验证得到同时GEO数据库和TCGA数据库同时达到要求的基因。(这一步可以学习《TCGA基础课程》《TCGA甲基化分析》
甲基化分析验证

那么写上面这样一篇思路的文章,需要学习哪些课程呢?

《GEO芯片分析》

《GEO数据库甲基化分析》

《GO富集分析》

《KEGG富集分析》

《共表达网络》

 

 

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码