TCPA蛋白数据库独立预后分析
时间:2020-02-02 来源:生信自学网 作者:乐伟
微信公众号:biowolf_cn 点击:次
TCPA蛋白数据库独立预后分析 独立预后分析的目的,是为了验证构建的模型是否可以独立于临床,作为独立的预后因子,那么首先需要准别独立预后分析的输入文件 1、独立预后分析输入文件准备 这个分析我们需要把各个样本的风险值和临床做比较,所有需要整理一个表格,包含这些数据:样本代号、生存时间、生存状态、风险值、其他临床如年龄、性别、分级、分期、T、N、M分期,需要这样一个表格,需要用到临床数据和风险值的数据,然后根据病人ID,把两份数据合并在一起,做后续分析。 在整理临床的时候,因为分析用到的和提取出来的格式有些不同,所以需要整理 首先找到是否有unknow的,需要把这些样本删掉,比如age里面有unknow的行删掉 性别,男性male改成1,female改成0 字段grade,G1改成1,G2改成2,G3改成3 字段stage,stageI改成1,stageII改成2,stageIII改成3,stageIV改成4 字段T,T1改成1,T2改成2,T3改成3,T4改成4 字段M,M0改成0,M1改成1,MX一般是删除 字段N,N0改成0,N1改成1,N2改成2,N3改成3,NX一般删掉 然后用生信自学网专利脚本:TCPA14.preIndep.pl 就可以得到独立预后分析的输入文件 2、独立预后分析 单因素独立预后分析 把临床性状和风险值一个一个输入,和生存时间生存状态进行比较,分析这些因素是否和生存相关,结果中有pvalue,HR和HR CI95%,如果某个因素pvalue<0.05,说明该因素和生存的相关性是显著的,当然这里最主要的是风险值这个因素的结果,如果风险值得到的p值小于0.05,是比较理想的结果。 多因素独立预后分析 将临床性状和风险值,一起输入,和生存时间生存状态进行比较,多因素独立预后分析考虑了因素之间的影响,得到的结果,如果riskScore的p值小于0.05,说明我们的风险值可以作为独立的预后因子。 输入文件:indepInput.txt,之前准备好的数据文件 R包:install.packages('survival') 函数:coxph() 然后分别绘制森林图 单因素独立预后分析森林图 多因素独立预后分析森林图 生信自学网精品课程推荐: 《TCGA蛋白质数据库TCPA挖掘》 《TCGA数据库m6A套路挖掘》 《TCGA单基因文章套路挖掘》 《中药复方网络药理学联合GEO芯片》 (责任编辑:伏泽 微信:18520221056) |
- 上一篇:风险曲线绘制TCPA数据库模型蛋白
- 下一篇:TCPA蛋白数据库多指标ROC曲线绘制