生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

TCGA数据库Counts和FPKM以及FPKM-UQ

首选你得知道如何进入TCGA数据库,知道如何选择需要的癌症分类,和数据类型,在选择基因表达的时候,经常遇到一个问题,有个选项:HTSeq-Counts,HTSeq-FPKM,HTSeq-FPKM-UQ,不少学员对此产生困惑,这里究竟应该如何选择,每个选项究竟是什么意思。
counts数据
简单的讲,Counts是数据后台没有处理的原始表达量,而FPKM和FPKM-UQ是两种数据处理方法,也就是说,如果下载Counts数据,是表达量数据,如果下载FPKM数据,那么要注意这些数据是经过处理的。正常情况下,我们下载Counts数据就可以了,特殊情况选择FPKM数据也是可以的。
接下来我们来看看FPKM的具体概念,究竟是什么样的处理结果:
FPKM
下载数据后,在数据分析时,用的方法也是不同的,Counts数据一般使用edgeR包或DESeq包,对数据做分析;如果下载FPKM数据,就不能使用edgeR包,只能只用DESeq包进行处理。
在使用edgeR包做Counts数据处理时,是需要对数据进行normalize的,所以我们在下载数据时,下载counts是比较常用的。

(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码