生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

TCGA数据库数据类型速查

不得不承认,TCGA数据库后台工作人员严谨的态度,和专业的数据分类和管理能力,在这方面国内的大数据发展和生物信息学数据库建立可以学习这种数据管理模式,以及数据共享的分享态度。
TCGA数据官方网站上的数据有独特的数据分类体系,其将数据分成不同的数据类型和不同的数据水平。数据类型在TCGA数据管理模式中,各个研究团队通过Agilent、Illumina、RNAseq等平台获得mRNA表达数据、microRNA表达数据、拷贝数数据、蛋白质数据、基因突变数据以及甲基化数据,同时收集癌症患者的临床数据,主要报告基本资料、治疗进程、临床分期和生存状况。
TCGA数据库数据分类

Agilent、Illumina、RNAseq等平台都可以测得上述多种类的数据(数据类型),包括样本基因组中的基因突变(插入/缺失)、DNA拷贝数、mRNA表达、microRNA表达、蛋白质表达和DNA甲基化数据。TCGA研究团队同时还获得了一些与癌症组织配对(matched)和不配对(un⁃matched)的正常组织样本的mRNA表达数据、microRNA表达数据、DNA拷贝数数据或者甲基化数据。
数据分类详情
有了临床数据,研究者可以统计相关癌症的临床信息,做患者的生存分析。有正常组织样本和癌症样本对照的表达数据,研究者可以做差异分析,得到差异的mRNA、miRNA以及差异的甲基化位点,为寻找癌症的差异表达基因,探寻癌症药物,提供数据基础。这也与TCGA的目标和梦想是一致的。

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码