单基因生存分析和单基因临床相关性分析单基因生存分析 接下来我们要讲解单基因的生存分析,目的就是看一下我们的基因是否跟预后相关。通过单基因生存分析我们可以得到这样的生存曲线,在这个生存曲线里面,它的横坐标就是生存时间,单位是年,纵坐标的话就是生存率。随着时间的推移,病人的生存率是下降的。 然后根据目标基因的表达的中位值,我们可以将病人分成高表达组和低表达组。然后我们可以比较一下高低表达两组之间生存是否具有差异,我们就可以看这个Pvalue。如果P小于0.05,就说明通过我们的目标基因对病人分成高低表达两组这两组之间生存是觉有差异的差异。 同时我们也可以做这样一个风险的表格,这个风险 表格的话,它的横坐标就是生存时间,单位是年,纵坐标的话就是我们这个基因,它的高低表达的两种状态。然后这里面的数值就是代表在每一个时间点剩余病人的数目,这就是我们当今生存分析的结果。 下面我们来绘制这两个图形,我们要准备的输入文件是我们基因的表达和生存数据合并后的文件。 然后我们打开我们的R软件,将我们准备好的代码拷贝到R中运行即可,大家如果感兴趣,可以购买我们的课程获得脚本文件和视频教程。 等待完成后,我们就可以得到生存分析的生存曲线和表格。 单基因临床相关性分析 做完生存分析后,我们就要做单基因的临床相关性分析,我们想看一下我们的基因跟哪些临床性状是具有相关性的。我们根据这个临床性状对我们的数据进行分组,分组以后看一下不同的临床分组之间,我们单基因的表达量是否具有差异,我们就可以得到临床相关性分析的图形。我们首先看一下左边这个图。左边这个图就是我们选取的目标基因,它跟分期的一个关系。横坐标就是分期,我们可以分为四类,也是一期,二期,三期,四期。然后纵坐标的话就是我们的目标基因的表达量,然后我们就可以每两个分期之间做一次差异分析。做完了差异分析之后,我们就可以得到Pvalue。 从这个图里面我们就可以看到一期和二期病人他的基因表达是具有差异的,然后一期和三期病人基因的表达也是具有差异的。同理,我们可以看到其他病人的差异关系。 我们再看一下这个基因表达和T分期的关系,和T分期的关系与上面的也是一样。这里就不再赘述。 下面我们来看一下我们要准备的输入文件,我们要准备的输入文件时目标基因的表达量文件symbol.txt,还有就时我们的临床数据文件clinical.txt,最后是我们的脚本文件。 准备好这些文件后,我们就要来绘制这些图形,我们打开R将我们的脚本文件拷贝到R中运行,运行结束后,我们可以得到很多个图形文件,这些文件就是我们单基因的差异相关性表达图形。 课程链接: 《TCGA数据库肿瘤微环境视频》 精品课程推荐: 《TCGA肿瘤免疫细胞浸润模式挖掘》 《GEO数据库免疫细胞浸润视频》 《甲基化免疫细胞浸润模式》 《TCGA数据库肿瘤微环境》 《TCGA数据库肿瘤突变负荷》 责任编辑:伏泽 作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载! |