生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

TCPA数据库蛋白预后模型构建

TCPA数据库蛋白预后模型构建
输入文件:预后筛查得到蛋白的结果数据,数据包括预后相关的蛋白表达,生存时间,生存状态

用到的R包:install.packages('survival')
函数:coxph()
构建模型的命令:coxph(Surv(futime,fustat) ~ .,data)
模型优化的方法:“both“,向前向后的方法
处理之后可以得到这些数据:
Coef:系数
HR:风险值
95%CI:HR.95L、HR.95H
Pvalue:多因素的p值就没有单因素那么重要,主要看得到的蛋白和系数

得到了多因素的结果之后,我们需要用多因素结果蛋白和系数构建预后模型,然后根据每个样本这几个蛋白的表达量计算每个病人风险值,这里用到的是R函数直接计算,可能会和直接手动计算存在一些差异,这个是正常的,但是每个病人的风险值排序是一致的。

接下来根据所有样本风险值的中位值,对所有样本进行分组,得到高低风险组,保存在risk.txt文件,这个文件用于后续分析

精品课程推荐:
《中药复方网络药理学联合GEO》
《单细胞测序分析》
《TCGA单基因发文套路挖掘》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码