We thank Dr. Jianming Zeng (University of Macau), and all the members of his bioinformatics team, and biotrainees, for generously sharing their experience and codes.

文章信息

本文通过多队列研究,探讨了糖代谢相关基因(CRGs)在急性髓系白血病(AML)中的预后价值和对治疗反应的预测能力。研究开发了一个包含 10 个基因的 CRG 预后标志物,并利用公共数据库和自身队列数据验证了其在预测 AML 患者生存方面的准确性和一致性。研究发现,高风险组患者的总生存期显著较短,且其免疫微环境受到强烈抑制。此外,糖代谢抑制剂在高风险组中显示出良好的治疗效果。基于 CRGs 的新风险模型为 AML 的预后分类和靶向治疗提供了新的思路和方法。

「题目」:Establishment and validation of a carbohydrate metabolism-related gene signature for prognostic model and immune response in acute myeloid leukemia「期刊」:Aging (Albany NY).「日期」:2022 Dec 5「DOI」:10.3389/fimmu.2022.1038570

文章分析思路

这个思路做的比较详细,可以作为大家数据挖掘类的课题思路参考:

使用的数据

bulkRNA seq和芯片数据:

  • GSE37642 (GPL 570, n = 140)
  • GSE37642 (GPL 96, n = 422)
  • GSE71014 (GPL 10558, n = 104)
  • GSE12417 (GPL 96, n = 162)
  • GSE12417 (GPL 570, n = 78)
  • TCGA(n = 151)

pbmc3k dataset:10x genomics

作者自己的数据:从2019年1月至2022年6月,最终在西南医科大学附属医院选择了106例新诊断的非M3亚型AML患者。

糖代谢相关基因 :从 KEGG 通路数据库中获取了 355 个糖代谢相关基因「(carbohydrate metabolism related genes,CRGs)」,这些基因被列在补充表 S9 中。部分如下:

文章用的代码:https://github.com/jmzeng1314/TCGA_AML_Glycolysis

致谢技能树文章:急性髓系白血病的预后标志物构建(公共数据库数据+自己的数据)

主要结果

一、AML 中识别与生存相关的 CRGs

从 TCGA 数据集中选取了 117 份非 M3 型 AML 样本的基因表达谱作为训练集,从 KEGG 数据库中获取了 355 个糖代谢相关基因(CRGs)。通过单变量 Cox 比例风险回归分析,研究者发现了 15 个与总生存期显著相关的 CRGs。「其中,4 个基因(CYB5R4、MLYCD、PIK3CA 和 PTEN)是保护因素,其余 11 个基因是风险因素。」

二:CRG 标志物的开发与验证

通过 LASSO 回归算法从 15 个与总生存期相关的糖代谢相关基因(CRGs)中筛选出 10 个关键基因,并基于这些基因的表达水平和回归系数开发了一个针对急性髓系白血病(AML)患者总生存期的最优 CRG 标志物。KM 分析显示,高危组患者的总生存期显著短于低危组,表明 CRG 标志物能够有效预测 AML 的预后。此外,CRG 标志物在 1 年、3 年和 5 年总生存期的预测准确性高于其他标志物。单变量和多变量 Cox 回归分析进一步证实了 CRG 标志物作为 AML 患者独立预后预测因子的有效性。

三:CRG 标志物的外部验证

研究者计算了 GEO 队列(GSE37642 和 GSE12417 的 GPL570 和 GPL96 平台,GSE71014 的 GPL10558 平台)以及自己队列中每位患者的危险评分。根据中位危险评分,患者被分为高危组和低危组。在 6 个外部测试集中,低危组中存活的患者数量多于高危组,且高危组患者的总生存期显著较短。这些结果表明 CRG 标志物在预测 AML 预后方面是有效的。

四:差异表达基因的鉴定与富集分析

通过DEseq2软件包分析了高危组与低危组之间的基因表达差异,鉴定出699个差异表达基因(DEGs),其中457个在高危组中上调,242个下调。GO和GSEA富集分析显示,这些差异表达基因主要富集在免疫反应和碳水化合物代谢相关途径。

五:不同风险组的免疫细胞比例和相关性分析

通过 ESTIMATE 软件分析了高危组和低危组的基质评分、免疫评分和估计评分,发现高危组的这些评分均高于低危组,提示高危组的肿瘤微环境中存在更多的免疫浸润细胞和基质细胞。此外,高危组的肿瘤纯度低于低危组,这与低肿瘤纯度的 AML 患者预后更差相一致。

六:风险组的突变特征

通过分析单核苷酸多态性(SNP)概况来探究CRG标志与急性髓系白血病(AML)突变之间的关系。研究发现,在高风险组和低风险组中,错义突变是最常见的基因突变类型。尽管NPM1、DNMT3A和FLT3突变在两组中均较为常见,但RUNX1、IDH2、WT1和KRAS突变在低风险组中更为频繁,而TP53、KIT和TTN突变在高风险组中更为常见。此外,低风险组患者的肿瘤突变负荷高于高风险组。

七:潜在药物敏感性

通过 oncoPredict R 包基于 CRG 标志评估了急性髓系白血病(AML)患者对化疗药物的潜在临床反应。oncoPredict R 包利用基线肿瘤基因表达数据预测化疗反应,并筛选出 P 值小于 0.05 的药物。研究发现,低危组患者对大多数糖代谢抑制剂表现出更高的敏感性。

文章中的致谢