生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

区分mRNA和和lncRNA

区分mRNA和和lncRNA

前面我们得到了基因的矩阵,接下我们我们就要将这个基因的矩阵进行整理,把它分为两个矩阵,一个编码蛋白的mRNA矩阵,另一个是长非编码RNA的矩阵。


我们要用到一个关于人的配置文件humang.gtf和基因的矩阵文件,这两个都是我们之前下载好的。



其中基因的矩阵文件里包含了两种RNA。
人的配置文件里包含了基因对应的属性,通过这个配置我们可以知道,哪个基因是属于蛋白编码RNA,哪个基因是属于长非编码RNA。
通过运行我们的脚本文件,我们可以得到两个文件,就是分离之后的mRNA矩阵和长非编码RNA的矩阵。



 
接下来我们要做的就是查找免疫相关的基因集,我们先要进入GSEA官网,找到下载基因集的地方,如图

也可以通过链接https://www.gsea-msigdb.org/gsea/msigdb/search.jsp进入。
在里面我们搜索我们要查找的基因集IMMUNE_RESPONSE
和IMMUNE_SYSTEM_PROCESS


然后我们就可以将搜索到的结果下载下来(我们要下载GMT格式)。




下载好后,我们可以通过mRNA的表达文件以及脚本文件在mRNA表达文件里提取出存在于两个基因集中的基因。



购买课程:
《免疫相关lncRNA文章套路视频课程》
精品课程推荐:
《TCGA数据库甲基化分型文章套路》
《GEO数据库miRNA芯片挖掘》
《中药复方网络药理学联合GEO芯片》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码