很多学员好不容易注册到一个账号,下载了数据,也找到了零零碎碎的一些分析思路,得到数据库之后,觉得非常麻烦,根本不知道如何入手分析。SEER数据库也提供一个本地化软件,可以下载和使用SEERStat提取和整理数据,当然SEERStat的下载也是注册用户才有的权限。
下载按照好SEERStat之后,我们需要根据自己的分析内容,删选信息,然后到处相关数据,一边后续分析使用。
常见字段的解释:
一、大写机构简写
ICD 国际疾病分类
WHO 世界卫生组织
ICCC 国际会议
AJCC 美国癌症联合委员会
CS 某癌症研究机构(一个对癌症分型做补充的机构)
IHS 印第安人卫生服务署
SEER 美国国立癌症研究所“监测、流行病学和结果数据库”
二、临床常用字段
Race recode 种族
Sex 性别
Year of diagnosis 诊断年份
Site recod IC-O-3/WHO 2008 肿瘤病人发病部位
Bihavior recode for analysis 肿瘤恶性/良性分类
Primary Site 原发灶部位
Histologic Type ICD-O-3 组织学类型
Grade 组织学分级
Laterality 双侧/单侧(比如乳腺癌肺癌)
ICD-O-3 Hist/behav 病例类型
Derived AJCC Stage Group,6th ed (2004+) 分期2004年第六版
RX Summ--Surg Prim Site (1999+) 原发部位手术信息(RX开头的字段都是指手术信息)
RX Summ--Surg Reg LN Sur (2003+) 局部淋巴结手术方式
RX Summ--Surg Oth Reg/Dis (2003+) 转灶手术方式
CS tumor size (2004+) 肿瘤大小
CS extension (2004+) 肿瘤进入程度
CS lymph nodes (2004+) 淋巴结情况
CS mets at dx (2004+) 转移部位
COD to site rec KM 生存状态
SEER cause-specific death classification 肿瘤相关死亡
SEER other cause of death classification 肺肿瘤的其他死亡原因
Survival months 生存时间月份
Sequence number 多原发
Frist malignant primary indicator 是否有多原发癌
Age at diagnosis 诊断年龄
以上字段为数据处理经常用到的,如果解释有错误请纠正,如果大家补充有更多字段解释,可以分享给大家,直接联系生信QQ,然后做补充。
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
|