生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

METABRIC数据库挖掘单因素与多因素独立预后分析

单因素与多因素独立预后分析

1、单因素独立预后分析
单因素独立预后分析,就是将我们的基因和临床性状一个一个的输入,跟我们的生存时间和生存状态进行比较,看我们的基因或者临床性状跟我们的生存是否相关。我们可以得到如下的图形,图形的第一列是我们的因素,它包括我们的基因,还有我们的临床性状,然后接下来就是Pvalue,如果P小于0.05的话,就说明我们这个因素跟我们的生存是相关的。从这个图里面,我们可以看到,这个基因的表达还有化疗,以及ER和HER2,跟我们的生存是相关的,然后接下来就是hr值HR值,我们可以看到我们的基因的HR值是1.4,大于1,说明我们这个基因是高风险的基因,也就是这个基因的表达越高病人的风险也越高。接下来我们看下旁边的森林图,我们可以从这个图里面可以看出哪些是高风险的因素,哪些是低风险的因素,中间的虚线正好是HR等于1。如果我们这个图形出现在虚线的右边的话,那他就是高风险的因素,如果它出现这个虚线的左边的话,那它就是低风险的因素。

接下来我们需要准备我们的输入文件,之前我们得到的单基因的数据,它的第一列就是样品的名称,然后是生存时间,生存状态以及这个基因的表达量,还有各种临床性状,我们要做的就是将我们的基因表达和这些临床性状一个一个的跟我们的生存时间和生存状态进行比较,看他们是否跟生存相关。输入文件准备好后就是我们的脚本文件,该文件是由我们生信自学网提供,有兴趣的学员可以购买相关视频学习,联系方式就在文件末尾。

设置好脚本文件的工作路径后,用R运行脚本文件,我们就可以得到我们的森林图,还有就是单因素的结果文件。


2、多因素独立预后分析
多因素独立预后分析,就是将我们的基因和所有的临床症状一起输入,跟我们的生存时间和生存状态进行比较。看我们的基因是否可以作为独立的预后因子,如下图我们可以看到我们的基因还有化疗,以及我们的年龄的P是小于0.001的,就说明这三个因素,它是可以作为独立的预后因子,就可以得到这样的结论,我们的基因可以独立于其他的临床性状作为独立的预后因子,那我们在临床应用上就可以只测这个基因的表达量,就可以去预测病人的生存期。这就是我们多因素的独立预后分析,我们也可以得到这样一个图形。

我们要准备的输入文件同样是单基因的数据,以及我们的脚本文件,但这里我们要做的就是将我们的基因表达和这些临床性状一起输入跟我们的生存时间和生存状态进行比较,看他们是否跟生存相关。

同样的,运行脚本文件,我们可以得到我们的森林图,和单因素的结果文件。






(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码