生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

lncRNA表达与生存数据合并

lncRNA表达与生存数据合并

上一篇文件我们下载了免疫相关的基因,提取了免疫相关基因的表达量,这一次我们要讲解通过共表达的方法得到免疫相关的lncRNA并将lncRNA的表达数据和生存数据合并。
我们先来看一下啊通过共表达的方法得到的免疫相关lncRNA

这个表格的第一列是免疫基因,第二列就是与免疫基因相关的lncRNA,第三列就是相关系数,第四列是Pvalue值,第五列是基因的调控关系,如果cor大于0,那它就是一个正调控的关系,如果cor小于0,那就是负调控的关系。

要得到这样一个免疫相关lncRNA的文件,我们需要用到两个输入文件,一个是免疫基因的表达量,另一个就是长非编码RNA的表达量。还有我们生信自学网提供的脚本文件。


在运行脚本之前,我们通过如下代码导入limma包,如果事先已经导入的话就可以不用再导入
if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")
 
BiocManager::install("limma")
 
通过R运行脚本文件,我们就会得到共表达的结果文件,还有免疫lncRNA的表达量文件,里面包含得到的免疫相关的lncRNA。
 


得到了lncRNA的表达量后我们就要将表达量与生存时间进行合并,得到如下一个表格。

这个表格第一列是样品的名称,第二列是病人的生存时间,第三列是病人的生存状态,接下来的就是长非编码RNA的表达量。有了这个文件,我们后续就可以做生存分析了。


我们要准备的输入文件是病人的临床数据,里面包含了生存时间和生存状态,还有就是我们得到的lncRNA的表达量文件。

我们将病人的临床数据文件进行整理,去除无用的样品,把剩下的数据的前三列信息提取出来单独放在一个txt文件中,这样我们的输入文件就准备好了。


通过perl运行我们提供的pl脚本,我们就可以得到表达量和生存数据合并后的文件。

购买课程:
《免疫相关lncRNA文章套路视频课程》
精品课程推荐:
《TCGA数据库甲基化分型文章套路》
《GEO数据库miRNA芯片挖掘》
《中药复方网络药理学联合GEO芯片》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码