生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > TCGA >

细胞肾癌肿瘤突变负荷与免疫浸润的关系探讨(

透明细胞肾癌肿瘤突变负荷与免疫浸润的关系探讨

Exploration of the relationships between tumor mutation burden with immune infiltrates in clear cell renal cell carcinoma
从TCGA数据库下载336例ccRCC患者的体细胞突变数据,使用“maftools”软件包分析突变谱。计算TMB,我们将样本分为高TMB组和低TMB组。使用“limma”包进行差异分析,比较两组之间的表达谱,我们从批生存分析中识别出9个hub tmb相关的签名。通过基因本体论(GO)分析和基因集富集分析(GSEA)筛选两组间显著富集的通路。基于定时器数据库,我们进一步评估了9个tmb相关特征突变体与ccRCC免疫浸润水平的关系。此外,我们利用“CIBERSORT”包估计了低tmb组和高tmb组之间22个免疫组分的丰度,并通过Wilcoxon秩和检验来确定显著性差异。采用Cox回归模型结合生存分析评估免疫细胞的预后价值。最后,我们根据多变量Cox结果构建了肿瘤突变负荷预后指数(TMBPI),并绘制了受试者工作特征曲线(ROC)来评估预测的准确性。
体细胞突变数据通过GDC数据门户(https://portal.gdc.cancer.gov/)从公开的TCGA数据库获得。数据的四种子类型文件,我们选择“蒙面体细胞突变”数据,并处理它基于VarScan软件。我们编写了体细胞突变注释格式(MAF)变体和实现了“maftools”(26)R包,它提供了多个分析模块来执行可视化过程。
TMB评分计算及预后分析
TMB定义为每百万碱基中检测到的体细胞基因编码错误、碱基替换、插入或缺失的总数量。我们通过Perl脚本基于JAVA8平台计算了每个样本的变异频率(3800万)。我们可以根据中位数数据将ccRCC样本分为低tmb和高tmb组。然后,我们通过样本的id号将TMB数据与对应的生存信息合并。采用Kaplan-Meier分析比较低tmb组和高tmb组的生存差异,计算log-rank检验的P。此外,我们进一步评估了TMB水平与临床特征的相关性,两组临床变量之间的比较采用Wilcoxon秩和检验,而Kruskal-Wallis (K-W)检验在何时总共有三个或更多基团。
 
差异表达基因及功能通路分析
根据TMB水平,我们通过R软件将ccRCC样本的转录组数据分为低TMB组和高TMB组。利用“Limma”对Fold Change (FC) =2、错误发现率(FDR) <0.05的两组差异表达基因(DEGs)进行鉴定。用“pheatmap”包绘制了热图来显示差异。然后使用db”包获取每个DEG的Entrez ID,使用“clusterProfiler”、“enrichment plot”和“ggplot2”包进行基因本体(GO)分析。以TMB水平为表型,基于JAVA8平台进行基因集富集分析(gene set enrichment analysis, GSEA)。我们选择了“c2.cp.kegg.v6.2.symbols”gmt基因集”作为参考基因集,从MSigDB数据库中获得(http://software.broadinstitute.org/gsea/msigdb/)。只考虑了FDR <0.25的显著富集途径。此外,我们从免疫学数据库和免疫分析门户(Immport)中获得了4677个免疫相关基因,通过免疫分析门户(Immunology Database and Analysis Portal, Immport)筛选两组间差异表达的免疫基因“维恩图”包。

图1 ccRCC样本的突变概况。瀑布显示了每个样本中每个基因的突变信息
图中,底部带有注释的各种颜色表示不同的突变类型。图例上方的吊杆
表现出突变负担。ccRCC,即透明细胞肾细胞癌。
 
生存分析
我们选择了Fold Change>2和FDR <0.05的前19个免疫基因,进一步评估差异免疫基因在低和患者的预后价值high-TMB水平。通过“for cycle”R脚本进行Bath生存Kaplan-Meier分析,寻找与生存结果相关的hub免疫基因,P值显示在plot中。P值<0.05差异有统计学意义。基于TIMER database(27)的“SCNA”模块(https://cistrome.shinyapps.io/timer/),我们进一步评估了ccRCC中具有免疫浸润的枢纽免疫基因突变类型。右下角显示了已知的6个枢纽基因的突变类型。以箱线图表示ccRCC中各突变状态下各免疫细胞亚群的分布,采用双侧Wilcoxon秩和检验,计算P值,比较各突变状态下各免疫细胞亚群与正常浸润水平的差异。同时,我们获得了两组ccRCC患者的转录组谱,并通过“limma”包进行规范化处理。然后,我们将准备数据放入后续分析中,通过CIBERSORT算法(R script v1.03)评估每个样本的免疫缺陷,利用基因表达数据估计混合细胞群体中成员细胞类型的丰度。CIBERSORT仍然基于已知的参考集,提供了22个白细胞亚型lm22的一套基因表达特征。用“pheatmap”包显示两组免疫细胞的分布情况。Wilcoxon ranksum 测试 是 利用 微分 abundances  比较低tmb组和高tmb组之间的免疫浸润,在“vioplot”包装上以P值显示。

ccRCC免疫细胞预后分析
在定时器数据库的基础上,我们进一步进行了免疫浸润细胞的多变量Cox,由来自R包“survival”的函数coxph()拟合。计算了95%置信区间的危险比(HR)。此外,我们还进行了Kaplan-Meier分析以显示不同的生存结果



图2带有统计计算的突变信息摘要。(A,B,C)根据不同的突变类型进行分类在误义突变占绝大部分的分类中,SNP的出现频率高于插入或缺失,C>T为
最常见的SNV;(D,E)特定样本的肿瘤突变负担;(F) ccRCC中前10个突变基因;(G)重合以及突变基因间的排他性关联。单核苷酸多态性;SNV,单核苷酸变异;ccRCC,透明细胞,肾细胞癌。
 

购买课程《肿瘤突变负荷联合免疫细胞浸润文章套路视频(TMB预后模型)》
精品课程推荐:

《泛癌多基因-基因家族文章套路》
《泛癌单基因文章套路》
《中药复方网络药理学》
《WGCNA四分文章套路》
《RNA结合蛋白RBP文章套路》


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码