Id转换及添加基因属性在上一篇文章中我们得到了一个样品的矩阵,有了这个矩阵以后我们就可以做接下来的分析。下一步也就是我们接下来需要讲解的,就是我们要将这个样品的id转化为基因的名字和基因的属性。我们先看一下我们要准备的脚本和输入文件,我们要准备三个文件,其中输入文件是我们上一篇文章中得到的mRNAmatrix.txt文件,另外两个文件分别是我们写好的脚本文件和一个human.gtf的文件,这两个文件如果大家有需要购买我们的视频的话,我们会连同视频一起给大家使用,所有的脚本文件都是我们生信自学网提供编写的。我们先看一下这个human.gtf文件,这个文件里有我们样品的id,还有对应的基因的名字和基因的属性,这些就是我们需要的。 准备好这些文件后,我们就可以运行我们的脚本,我们打开cmd,用perl运行pl脚本,等待运行完成。我们最终可以得到这样一个文件: 这个文件就包含了基因名和基因的属性,通过这个文件,我们就可以知道哪些是长非编码的RNA,哪些是蛋白编码的mRNA。 课程链接: TCGA数据库批量挖掘lncRNA视频 相关课程: 长非编码RNA芯片数据挖掘视频 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |