知识的价值不在于占有,而在于使用。

生信自学网-速科生物-生物信息学数据库挖掘视频教程

当前位置: 主页 > SEER >

SEER数据整理常用字段SEERStat字段名称

时间:2017-08-15 07:25来源:原创 作者:森莘 点击:
SEER数据库包含的临床数据非常丰富,有很多字段,在分析的时候我们首先需要知道这些字段究竟是什么意思,这样我们在做数据整理的时候才好选择,数据筛选数据导出,数据整理都需

很多学员好不容易注册到一个账号,下载了数据,也找到了零零碎碎的一些分析思路,得到数据库之后,觉得非常麻烦,根本不知道如何入手分析。SEER数据库也提供一个本地化软件,可以下载和使用SEERStat提取和整理数据,当然SEERStat的下载也是注册用户才有的权限。
下载按照好SEERStat之后,我们需要根据自己的分析内容,删选信息,然后到处相关数据,一边后续分析使用。
SEERStat软件
常见字段的解释:
一、大写机构简写
ICD 国际疾病分类
WHO 世界卫生组织
ICCC 国际会议
AJCC 美国癌症联合委员会
CS 某癌症研究机构(一个对癌症分型做补充的机构)
IHS 印第安人卫生服务署
SEER 
美国国立癌症研究所“监测、流行病学和结果数据库”
SEER数据库常用临床字段
二、临床常用字段
Race recode 种族
Sex 性别
Year of diagnosis 诊断年份
Site recod IC-O-3/WHO 2008 肿瘤病人发病部位
Bihavior recode for analysis 肿瘤恶性/良性分类
Primary Site 原发灶部位
Histologic Type ICD-O-3 组织学类型
Grade 组织学分级
Laterality 双侧/单侧(比如乳腺癌肺癌)
ICD-O-3 Hist/behav 病例类型
Derived AJCC Stage Group,6th ed (2004+) 分期2004年第六版
RX Summ--Surg Prim Site (1999+) 原发部位手术信息(RX开头的字段都是指手术信息)

RX Summ--Surg Reg LN Sur (2003+) 局部淋巴结手术方式
RX Summ--Surg Oth Reg/Dis (2003+) 转灶手术方式
CS tumor size
 (2004+) 肿瘤大小
CS extension (2004+) 肿瘤进入程度

CS lymph nodes (2004+) 淋巴结情况
CS mets at dx (2004+) 转移部位
COD to site rec KM 生存状态
SEER cause-specific death classification 肿瘤相关死亡
SEER other cause of death classification 肺肿瘤的其他死亡原因
Survival months 生存时间月份
Sequence number 多原发
Frist malignant primary indicator 是否有多原发癌
Age at diagnosis 诊断年龄
以上字段为数据处理经常用到的,如果解释有错误请纠正,如果大家补充有更多字段解释,可以分享给大家,直接联系生信QQ,然后做补充。

 

 


加生信自学网群
责任编辑:伏泽
作者申明:本文版权属于生信自学网(微信号:18520221056)未经授权,一律禁止转载!
BioWolf二维码生成器
------分隔线----------------------------
GEO芯片数据库挖掘生信视频教程
推荐内容
TCGA数据库挖掘文章套路生信视频教程
中药复方网络药理学文章套路生信视频教程