知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > TCGA >

TCGA数据库Counts和FPKM以及FPKM-UQ

时间:2017-08-27 21:21来源:原创 作者:森莘 点击:
在做TCGA数据库分析时,下载基因表达矩阵时,遇到一个选项,需要选择Counts、FPKM、FPKM-UQ,很多学员有点困惑,这些都是什么区别呢?
首选你得知道如何进入TCGA数据库,知道如何选择需要的癌症分类,和数据类型,在选择基因表达的时候,经常遇到一个问题,有个选项:HTSeq-Counts,HTSeq-FPKM,HTSeq-FPKM-UQ,不少学员对此产生困惑,这里究竟应该如何选择,每个选项究竟是什么意思。
counts数据
简单的讲,Counts是数据后台没有处理的原始表达量,而FPKM和FPKM-UQ是两种数据处理方法,也就是说,如果下载Counts数据,是表达量数据,如果下载FPKM数据,那么要注意这些数据是经过处理的。正常情况下,我们下载Counts数据就可以了,特殊情况选择FPKM数据也是可以的。
接下来我们来看看FPKM的具体概念,究竟是什么样的处理结果:
FPKM
下载数据后,在数据分析时,用的方法也是不同的,Counts数据一般使用edgeR包或DESeq包,对数据做分析;如果下载FPKM数据,就不能使用edgeR包,只能只用DESeq包进行处理。
在使用edgeR包做Counts数据处理时,是需要对数据进行normalize的,所以我们在下载数据时,下载counts是比较常用的。

加生信自学网群
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
BioWolf二维码生成器
------分隔线----------------------------
GEO芯片数据库挖掘生信视频教程
推荐内容
TCGA数据库挖掘文章套路生信视频教程
中药复方网络药理学文章套路生信视频教程