生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

Id转换及添加基因属性

Id转换及添加基因属性

在上一篇文章中我们得到了一个样品的矩阵,有了这个矩阵以后我们就可以做接下来的分析。下一步也就是我们接下来需要讲解的,就是我们要将这个样品的id转化为基因的名字和基因的属性。

我们先看一下我们要准备的脚本和输入文件,我们要准备三个文件,其中输入文件是我们上一篇文章中得到的mRNAmatrix.txt文件,另外两个文件分别是我们写好的脚本文件和一个human.gtf的文件,这两个文件如果大家有需要购买我们的视频的话,我们会连同视频一起给大家使用,所有的脚本文件都是我们生信自学网提供编写的。我们先看一下这个human.gtf文件,这个文件里有我们样品的id,还有对应的基因的名字和基因的属性,这些就是我们需要的。



准备好这些文件后,我们就可以运行我们的脚本,我们打开cmd,用perl运行pl脚本,等待运行完成。我们最终可以得到这样一个文件:


这个文件就包含了基因名和基因的属性,通过这个文件,我们就可以知道哪些是长非编码的RNA,哪些是蛋白编码的mRNA。


课程链接:
TCGA数据库批量挖掘lncRNA视频

相关课程:
长非编码RNA芯片数据挖掘视频


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码