生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

TCGA突变数据如何做分析?

在之前的课程中,我们给大家详细介绍了,TCGA数据库基础分析,基因数据下载,数据提取,生存分析;ceRNA网络构建,cox风险回归模型;TCGA甲基化分析,甲基化驱动基因分析;还有单独讲解TCGA临床分析,组间差异分析等;丰富的内容,专业的课程讲解,让很多学员不但基础知识提高,而且也有很多学员成功发文见刊(购买课程:生信商城)。
在答疑过程中(答疑QQ:2749657388),很多学员建议我们录制SNP突变数据分析,那么接下来我们给大家介绍SNP。SNP(单核苷酸多态性)主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均没500-1000个碱基对中就有1个,估计其总数可达300万个甚至更多。

那么首先要解决的数据下载,关于数据下载,我们之前也一直强调,一定要从官网下载:https://cancergenome.nih.gov/;之前也有学员说,他在其他网址下载数据,做好分析写好论文投稿,最后编辑说数据可靠性无法保证,只能退稿,重新下载数据,重新分析写论文,希望各位学员引以为戒,官网的数据下载和整理相对麻烦,但是只要大家耐心学习我们的课程,跟着课程操作,用脚本就可以很方便的提取和整理数据。

下载好数据,接下来需要对数据进行处理,大部分基因在很多样品里面都是没有突变的,下载了数据之后,先对样品的图片情况进行排序,看看哪些样品在癌症里面图片的频率比较高,重点关注这些基因。


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码