SEER数据库分析快速发文
时间:2017-08-19 15:27来源:原创 作者:森莘 点击:
次
SEER数据库包含大量的癌症患者临床信息,是生存分析,药物研究的利器,使用好SEER数据库,可以用最优思路得到一个好的科研报告。
前面的短文我们讲解了SEER数据库,官方提供的SEERStat软件的下载与安装,以及TCGA数据库与SEER数据库的区别,有了这些知识,接下来就到了大家最关系的问题,如果利用SEER数据库下载和分析数据,下载的数据可以做哪些分析,现在论文都是怎样一个分析思路?
带着这些问题,给大家讲解下主要的分析方法。
首先看下SEER数据库经常用到的一些字段
当然我们比较关系的字段根据我们的分析是不同的,用的比较集中的包括癌症发生部位,癌症分期、分级、TNM分期,是否多原发,生存时间,生存状态,是否癌症死亡等等。
有了这些字段我们就可以做很多分析,最基本的生存分析,也就是论文最常出现的KM分析;然后是多因素COX分析,相比KM分析,COX有很多优点,KM没有矫正其它因素的影响,如果需要确定到底某个因素是不是影响生存的独立危险因素,就要用到像Cox这种多因素生存分析模型。
接下来做的是卡方检验,卡方检验是一种用途很广的计数资料的假设检验方法。
竞争风险模型分析,可以计算多个终点时间,SEER数据库是提供是否死于癌症这个字段,那么死亡就有多个原因,可以分成两类,一类是癌症死亡,一类是其他非当前癌症死亡。
多原发癌,这个是现在比较流行的分析,也是SEER数据分析的重头戏,SEER数据库可以提取到多原发的信息。
JoinPoint分析,数据库提供一个软件专门做数据的JoinPoint分析。
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
|
BioWolf二维码生成器
------分隔线----------------------------