生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

TCGAmiRNA做差异表达分析

在之前的推文我们讲解了如何从TCGA数据库下载miRNA数据,并且利用perl脚本提取miRNA的表达矩阵,这里给大家讲解如何做TCGA数据库miRNA差异表达分析,首先很容易想到,基因的差异表达分析,对,其实miRNA差异表达和TCGA数据库基因差异表达很类型。那么我们现在开始讲解TCGA数据库如何做miRNA差异表达分析。
首先我们要安装R包,如何还没有安装R软件的学员,先安装好R软件,再来安装R包。
这个是R包的命令:

source("http://bioconductor.org/biocLite.R")
biocLite("edgeR")
install.packages("gplots")

安装好R包,接下来就是输入R脚本的命令,这个脚本是BioWolf培训中心专业开发的TCGA数据挖掘脚本。在设置过滤条件是,这里需要把过滤条件适当放宽,因为miRNA矩阵里面的miRNA总量不多,如果条件限制太过严格,就导致得不到差异基因了。
在R软件跑了上述脚本之后,我们就得到了差异表达的miRNA不多,这个是正常情况,需要理性看待,差异表格里面的参数也和基因差异表达时一样的。

foldChange=1
padj=0.05

setwd("目录")                  #设置工作目录
library("edgeR") 
bio=read.table("biowolf.txt",sep="\t",header=T,check.names=F)  #改成自己的文件名
bio=as.matrix(bio)
rownames(bio)=bio[,1]
biowolf=bio[,2:ncol(bio)]
dimnames=list(rownames(biowolf),colnames(biowolf))
bw=matrix(as.numeric(as.matrix(biowolf)),nrow=nrow(biowolf),dimnames=dimnames)
bw=avereps(data)
bw=bw[rowMeans(bw)>0,]
...
...

TCGA数据库差异miRNA
下面是得到的火山图和热图,火山图的打点明显比差异基因少很多,因为我们火山图就是一个一个打点,然后对有上调下调的miRNA用颜色再打一次,就得到我们现在看到的火山图。
TCGA数据库差异miRNA火山图
热图的横坐标是样本,TCGA数据库下载的样本数目是很多的,有些癌症有几百个样本。纵坐标是差异的miRNA,数目不多。
差异miRNA热图
那么我们的差异miRNA就讲解完了,得到差异miRNA之后,我们就可以做后续分析,下次我们会讲解如何构建共表达网络。我们的TCGA数据库挖掘会持续更新,希望大家一如既往的关注。


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码