TCGA甲基化驱动基因文献解读
时间:2019-07-29 来源:生信自学网 作者:乐伟
微信公众号:biowolf_cn 点击:次
Exploration of methylation‑driven genes for monitoring and prognosis of patients with lung adenocarcinoma 甲基化驱动基因监测肺腺癌患者预后的探讨 摘要 背景:肺癌是人类最常见的恶性肿瘤之一,其发病率和死亡率逐渐升高。本研究检测了肺癌(LUAD)特异的预后相关甲基化驱动基因,为LUAD患者的预后预测和个性化靶向治疗提供依据。 生信自学网暑期秒杀活动,TCGA甲基化学习优惠抢购中: 《TCGA甲基化差异分析生存分析》原价1100元 秒杀价368元 《TCGA甲基化驱动基因》原价400元 秒杀价128元 注意:TCGA甲基化驱动基因是基于TCGA甲基化差异分析生存分析课程讲解的 加入秒杀 活动时间:2019年7月25日-2019年7月28日 方法:在TCGA数据库中下载LUAD患者的甲基化和生存时间数据。基于β-混合模型,采用甲基混合算法对LUAD和邻近组织的甲基化状态进行鉴别,得到与疾病相关的甲基化驱动基因。然后用Cox回归模型筛选与LUAD预后相关的甲基化驱动基因,建立了基于5个甲基化驱动基因表达谱的线性风险模型。采用甲基化和基因表达相结合的生存分析方法,进一步独立探讨5个基因的预后价值。 结果:在LUAD组织和邻近组织中有118个甲基化驱动基因的差异表达。其中5个基因CCDC181、PLAU、S1PR1、ELF3和KLHDC9被用于构建预后风险模型。总的来说,高风险组的生存时间明显低于低风险组(P<0.05)。此外,甲基化和基因表达联合生存分析发现,CCDC181、PLAU和S1PR1基因以及KLHDC9基因的联合表达水平可作为独立的预后标志物或药物靶点。 结论:本研究为后续的LUAD早期诊断和预后评估提供了重要的生物信息学基础和相关的理论依据 接下来看看作者的分析思路: 一、数据处理与分析 我们从TCGA数据库下载了LUAD患者的甲基化和mRNA表达数据。其中507个样本的甲基化数据,包括32个正常样本和475个癌症样本,594个样本的mRNA表达数据,包括59个正常样本和535个LUAD样本。首先,基于limma包,对下载的数据进行归一化和差异分析,得到异常甲基化基因和差异表达基因。然后,基于R实现的甲基混合算法,计算了基因甲基化水平与基因表达的相关性。接下来,我们通过构建β-混合模型确定了显著相关的基因,并确定了疾病特异性低甲基化和高甲基化基因。最后,对甲基化驱动基因进行了筛选。此外,我们筛选了244个具有I期LUAD的样本,这些样本都具有表达和临床信息,以供进一步检测。TCGA提供的数据是公开的,不需要获得当地道德委员会的批准。 二、甲基化驱动基因的功能和途径富集分析 注释、可视化和综合发现数据库(david)V6.8(http://david.abcc.ncifcrf.gov/)是一个用于确定目标分子之间关联的开源平台。consensuspathdb(http://cpdb.molge n.mpg.de/)整合了智人的相互作用网络,包括二元和复合信号、基因调控和药物靶向相互作用以及生化途径。 三、风险评估模型的构建与风险评分计算 为了进一步筛选预后相关的甲基化驱动基因,采用单因素多变量Cox分析建立了LUAD甲基化驱动基因的线性风险评估模型。 四、生存模型中驱动基因和甲基化位点的Kaplan–Meier曲线的绘制,联合生存分析 为了进一步探讨甲基化驱动基因的预后评估,我们从下载的LUAD甲基化数据中提取了驱动基因甲基化的相关位点。然后,基于生存率R包,结合TCGA中LUAD的临床资料和预后信息,对驱动基因和相关甲基化位点进行预后生存分析,并得出Kaplan-Meier曲线。此外,我们对LUAD患者的甲基化水平和驱动基因的基因表达水平进行了联合生存分析,以进一步确定与预后相关的关键基因,并通过生存R包获得了联合生存曲线。 加入秒杀活动,购买TCGA甲基化分析课程 (责任编辑:伏泽 微信:18520221056) |