生信自学网-速科生物-生物信息学数据库挖掘视频教程

主页 > 生信数据库 >

WGCNA的入门和进阶:(三)WGCNA在科研文章中的应

WGCNA的入门和进阶:(三)WGCNA在科研文章中的应用

有关WGCNA的科研文章数不胜数,我们从其中挑选出了几篇与大家一起分享,一起学习如何在科研中灵活使用WGCNA 
1、通过WGCNA确定了一个与临床信息高度相关的module,并解释了该module的生物学作用。
WGCNA identification of CXCL13 and associated genes involved in the Tumor Immune Microenvironment (TIME) of lung adenocarcinoma于20205月1日发表在J Immunol。
肺癌是第二大最常见的诊断癌症,在美国与癌症相关的死亡人数最多。非小细胞肺癌(Non-small cell lung cancer, NSCLC)占肺癌病例的75%以上,其中以肺腺癌(LUAD)最为常见。研究证明,趋化因子及其受体在许多癌症中是高表达的,这可能导致异常的信号转导。CXCL13及其受体CXCR5的升高与死亡率相关,但这些因素如何促进NSCLC的发展,其确切机制尚不完全清楚。本文研究了CXCL13, CXCR5及其相关基因在NSCLC肿瘤免疫微环境中的表达作用。利用WGCNA建立与临床特征高度相关的基因簇。23329个转录本聚类为37个模块。light-cyan模块由491个基因组成,同时包含CXCR5和CXCL13。light-cyan模块含有大量的hub基因,其中前300个转录本高于了hub基因阈值(kMe > 0.6)。light-cyan模块中的转录本与年龄呈负相关。与light-cyan模块显著相关的生物过程包括免疫系统过程、淋巴细胞激活的调节、免疫反应的调节和细胞防御反应。总的来说,本文确定的基因module及其与临床信息的相关性为了解NSCLC及其肿瘤免疫微环境的复杂生物学提供了新的视角。
2、通过WGCNA寻找hub基因。
Oncogenic Network and Hub Genes for Natural Killer/T-Cell Lymphoma Utilizing WGCNA于20203月5日发表在Frontiers in Oncology
自然杀伤NKT细胞淋巴瘤(NKTCL)是非霍奇金淋巴瘤的一个亚型,具有连续的侵袭性和不良预后。NKTCL的分子机制尚未得到很好的研究。在此,本文揭示了NKTCL中与淋巴瘤相关的异常基因和生物学过程。通过基因本体论(GO)分析和通路富集分析,作者发现细胞外基质(ECM)受体相互作用通路和T细胞受体信号通路是NKTCL的主要异常通路。通过WGCNA,构建NKTCL (SRP049695)基因共表达网络,并鉴定hub基因LMO3、GRB14。另外,作者还使用了另一个基因表达数据集(GSE69406)来验证这些hub基因。此外,通过生存分析(GSE90597)对这些hub基因进行了鉴定和验证。这些结果为NKTCL的发病机制提供了新的见解。特别值得注意的是,LMO3和GRB14可能是诊断和治疗NKTCL的潜在癌蛋白和生物标志物。
3、利用WGCNA寻找hub lncRNA,并解释其功能。
LncRNAs related key pathways and genes in ischemic stroke by weighted gene co-expression network analysis (WGCNA)20205月发表在GENOMICS
缺血性脑卒中(IS)是一个重要的公共健康问题,而长链非编码RNA (lncRNAs)在缺血性脑卒中的生物学过程中越来越重要,但lncRNAs在缺血性脑卒中的潜在机制尚未完全了解。本研究选取3例确诊的IS患者和3例对照者构建lncRNA文库。利用WGCNA筛选IS相关的关键lncRNA模块。通过module membership (MM)和module membership (GS)的筛选鉴定关键lncRNA。采用《Kyoto Encyclopedia of Genes and Genomes》通路富集分析识别关键通路,采用蛋白-蛋白相互作用(protein-protein interaction, PPI)网络方法识别关键基因。结果共研究了3627个lncRNA,分析了17个模块,只有一个模块与IS高度相关。通过KEGG pathway分析发现,该模块的lncRNA显著富集在人T细胞淋巴细胞型病毒-1 (HTLV-1)感染以及mTOR信号通路,这表明这两个通路可能影响IS的发展。此外,选择top 2(根据MMGS)的基因AKT1和MAPK14作为PPI网络中的hub基因。综上所述,本研究确定的关键通路和基因可能作为未来IS精确诊断和治疗的生物标志物和靶点。
4、WGCNA与表型的关联以及hub基因的确定。
WGCNA analysis of the subcutaneous fat transcriptome in a novel tree shrew model该文章2020年3月26发表在EXPERIMENTAL BIOLOGY AND MEDICINE 
肥胖与遗传和环境因素有关。不同肥胖组特定组织的共表达基因网络为分析和识别相关通路和基因提供了一个方法。本文希望在树鼩动物模型中,从其脂肪组织中提取不同肥胖表型的mRNA,确定有意义的基因共表达网络;进一步分析肥胖可能的通路和hub基因,寻找潜在的药物靶点。作者从F1群体中选取10只树鼩,根据其Lee‘s指数分为3组进行mRNA测序。通过WGCNA,作者在差异表达的基因中识别出高度相关的基因module。三个模块与至少一个肥胖表型密切相关(cor:0.94 ~ 0.85,P <= 0.01)。blue模块的基因(481个基因)主要富集于核糖体途径。brown模块的基因(389个基因)主要富集于溶酶体途径。turquoise模块中的基因(包括1781个基因)主要富集在泛素介导的蛋白水解途径。每个模块的hub基因被确定,蓝色模块UBA52,棕色模块的AKT1,turquoise模块的LRRK2。通过对肥胖树鼩基因共表达网络的分析,本文确定了可能参与肥胖发展的不同基因和生物途径。对不同基因和途径的进一步研究可能为肥胖的预防和治疗提供新的靶点。
5、通过WGCNA寻找易感module和hub基因。
Identification of Susceptibility Modules and Genes for Cardiovascular Disease in Diabetic Patients Using WGCNA Analysis该文章于20205.11日发表在Journal of Diabetes Research 
利用WGCNA,确定糖尿病患者心血管疾病的易感模块和基因。GSE13760的原始数据从Gene Expression Omnibus (GEO)网站下载。FDR<0.01以及log2FC>1=0.5的差异基因用于后续分析。利用WGCNA构建基因共表达网络,筛选重要模块hub基因。GO和KEGG富集分析的基因模块具有临床兴趣。显著性在0.2以上以及module membership在0.8以上的基因被作为hub基因。随后,作者在发表的心血管疾病全基因组SNP数据中筛选了这些hub基因,overlap的基因被定义为key基因。通过WGCNA分析构建了14个基因共表达模块。绿色和黄色与糖尿病最显著相关。GO分析显示,模块中绿色黄色的基因主要富集于细胞外基质组织、细胞外泌体和钙离子结合。KEGG分析显示,模块中绿黄基因主要富集于抗原处理递呈、吞噬小体。15个基因被鉴定为hub基因。最终确定HLA-DRB1、LRP1和MMP2为key基因。这是首个利用WGCNA方法构建共表达网络来探索糖尿病相关易感性模块和心血管疾病基因的研究。本研究确定了一个模块和几个关键基因,它们在糖尿病相关心血管疾病的病因学中起重要作用,这可能会为糖尿病相关心血管疾病的分子机制提供更多的基础知识。 
总结:通过对以上5篇文章的初步阅读,我们发现WGCNA在文章里干的事情主要就是鉴定基因module,关联表型数据,鉴定hub 基因(当然,WGCNA主要也是通过这几个问题开发出来的)。各位学员如果在实际项目中有相关分析的需求,不妨试试WGCNA呀!


(责任编辑:伏泽   微信:18520221056)

森莘老师微信二维码