生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

TCPA蛋白数据库独立预后分析

TCPA蛋白数据库独立预后分析
独立预后分析的目的,是为了验证构建的模型是否可以独立于临床,作为独立的预后因子,那么首先需要准别独立预后分析的输入文件
1、独立预后分析输入文件准备

这个分析我们需要把各个样本的风险值和临床做比较,所有需要整理一个表格,包含这些数据:样本代号、生存时间、生存状态、风险值、其他临床如年龄、性别、分级、分期、T、N、M分期,需要这样一个表格,需要用到临床数据和风险值的数据,然后根据病人ID,把两份数据合并在一起,做后续分析。
在整理临床的时候,因为分析用到的和提取出来的格式有些不同,所以需要整理
首先找到是否有unknow的,需要把这些样本删掉,比如age里面有unknow的行删掉
性别,男性male改成1,female改成0
字段grade,G1改成1,G2改成2,G3改成3
字段stage,stageI改成1,stageII改成2,stageIII改成3,stageIV改成4
字段T,T1改成1,T2改成2,T3改成3,T4改成4
字段M,M0改成0,M1改成1,MX一般是删除
字段N,N0改成0,N1改成1,N2改成2,N3改成3,NX一般删掉
然后用生信自学网专利脚本:TCPA14.preIndep.pl

就可以得到独立预后分析的输入文件
2、独立预后分析
单因素独立预后分析
把临床性状和风险值一个一个输入,和生存时间生存状态进行比较,分析这些因素是否和生存相关,结果中有pvalue,HR和HR CI95%,如果某个因素pvalue<0.05,说明该因素和生存的相关性是显著的,当然这里最主要的是风险值这个因素的结果,如果风险值得到的p值小于0.05,是比较理想的结果。

多因素独立预后分析
将临床性状和风险值,一起输入,和生存时间生存状态进行比较,多因素独立预后分析考虑了因素之间的影响,得到的结果,如果riskScore的p值小于0.05,说明我们的风险值可以作为独立的预后因子。

输入文件:indepInput.txt,之前准备好的数据文件
R包:install.packages('survival')
函数:coxph()
然后分别绘制森林图
单因素独立预后分析森林图

多因素独立预后分析森林图


生信自学网精品课程推荐:
《TCGA蛋白质数据库TCPA挖掘》
《TCGA数据库m6A套路挖掘》
《TCGA单基因文章套路挖掘》
《中药复方网络药理学联合GEO芯片》



(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码