生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

批量挖掘lncRNA数据合并

批量挖掘lncRNA数据合并

        上一篇文章我们已经从官网上下载好了数据,下面我们对其进行数据合并,我们需要把这些数据变成如图一个表格,它的行名是基因的id,列名是样品名。


具体操作:

        1、我们先将之前我们下载的压缩包进行解压,解压后会得到很多的文件夹,每个文件夹中都有一个样品文件的压缩包,接下来我们要做的就是把所有文件夹中的文件压缩包全部提取出来放到一个文件夹中,方便做后续的分析。这就需要用到一个pl脚本,里面提供的对这些文件夹进行处理的代码。


        2、我们在装有perl的电脑上用cmd运行我们的pl脚本。我们就可以把所有文件夹里的文件压缩吧拷贝到一个文件夹中,就是我们的file文件夹,最后在将里面的压缩包全部解压就行了。




       3、 下一步就是整理这些文件,将这些文件样品文件进行合并,我们用到两个文件,一个是整理这些文件的脚本文件吗,另一个就是上一篇我们教大家下载的metadata文件。


        4、通过运行我们的pl文件,我们可以得到mRNAmatrix.txt文件,打开这个文件,里面就是合并后的样品文件,其中有4个正常样品和178个肿瘤样品。有了这个矩阵后,我们就可以做后续的分析。


课程链接:
TCGA数据库批量挖掘lncRNA视频

相关课程:
长非编码RNA芯片数据挖掘视频



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码