PeerJ | 一项综合分析确定了一个与自噬相关的风险模型,用于预测 I 期肺腺癌的复发和免疫治疗反应

导语

结果:
LUAD 复发与自噬相关风险模型的识别
基于 TCGA 数据库中 269 例 I 期 LUAD 患者,作者进行了单变量 Cox 回归,发现了 43 个与癌症复发显著相关的自噬基因。图 1A 显示了前 10 基因,如 RAB1A、MFN1 和 XPO1。随后,作者进行了 LASSO 回归分析(见图 1B 和 1C),发现了 19 个与 LUAD 患者复发相关的枢纽基因(见图 1D)。通过整合这 19 个基因,作者建立了风险模型,称为自噬评分,包括 10 个保护因子(CALCOCO2、MAP1LC3B、TRIM8、PARK2、MAPT、PDK2、PTEN、GABBR2、CXCR3 和 TFEB)和 9 个风险因子(RAB1A、BCL2L1、PIK3CA、GOPC、CHMP4B、VPS37D、GRID2、RPS6KB1 和 GPR37)。风险评分如下:自噬得分 = 0.4563488 * RAB1A + 0.318107141 * BCL2L1 + 0.253867908 * PIK3CA + 0.237767088 * GOPC + 0.18501832 * CHMP4B + 0.114654237 * VPS37D + 0。 10932385 * GRID2 + 0.026645972 * RPS6KB1 + 0.00210073 * GPR37 − 0.182756828 * CALCOCO2 − 0.147361444 * MAP1LC3B − 0.133470853 * TRIM8 − 0.105113941 * PARK2 − 0.073555698 * MAPT − 0.067317524 * PDK2 − 0.060281667 * PTEN − 0.053339503 * GABBR2 − 0.045620769 * CXCR3 − 0.026292117 * TFEB。为了探究这些枢纽基因之间是否存在相互作用,作者对创建的 PPI 网络应用了 STRING 数据库。

根据节点度数,作者确定 MAP1LC3B 为核心基因(见图 1E)。接下来,在 TCGA 训练队列中,患者根据上述自噬评分分为两组,包括低风险组和高风险组。此外,Kaplan-Meier 曲线分析显示,高风险患者的复发率高于低风险患者(图 2A,P < 0.0001)。 ROC 曲线分析显示,1、3 和 5 年的曲线下面积(AUC)分别为 0.701、0.836 和 0.818(见图 2B)。自噬评分的决策曲线分析见图 2C。此外,多元 Cox 回归表明自噬评分是 RFS 的独立预测因子(图 2D,HR = 4.8,95% CI [3.25–7.2],P < 0.001)。此外,作者创建了一个包含四个变量(性别、年龄、吸烟史和自噬评分)的传记图,以预测患者的复发率(见图 2E)。

图 1。构建自噬相关风险模型,预测 TCGA 数据库中 LUAD 患者的复发情况。

(A)单变量 Cox 回归中的前十名基因。(B,C)LASSO 分析和交叉验证识别出 19 个枢纽复发相关基因。(D) 19 个与自噬相关的枢纽基因及其系数。(E) PPI 核心网络。LUAD,肺腺癌;PPI,蛋白质间相互作用;LASSO,最小绝对收缩与选择算符。

图 2。自噬评分可以预测射频刺激综合征(RFS)。

(A)高自噬评分患者 RFS 较短(P < 0.0001)。(B) RFS 自噬评分的 1 年、3 年和 5 年时的 AUC。(C)自噬评分的决策曲线分析。(D)多元 Cox 回归显示自噬评分是 RFS 的独立预测因子(P < 0.001)。(E)用于计算 LUAD 患者 RFS 的命名图。LUAD,肺 A 腺癌;RFS,无复发存活;AUC,曲线面积。

风险模型的外部验证
作者使用 GSE30219 和 GSE37745 来验证作者的风险模型的性能。生存分析(图 3)显示,高风险患者的 RFS 在 GSE30219(P = 0.023)和 GSE37745(P = 0.0012)中表现更差。较高的 AUC 值表明模型的辨别能力更强,意味着它能更准确地区分高风险和低风险组。接近 1 的数值表示性能优异,而接近 0.5 的数值则表示模型随机且无预测力。因此,作者进行了 ROC 曲线分析,发现 1、3 和 5 年的 AUC 分别为 GSE30219 为 0.541、0.694 和 0.706,GSE37745 为 0.656、0.685 和 0.673,表明风险模型表现良好。

图 3。在不同 GEO 队列中进行外部验证。

(A)GSE30219 年,Kaplan-Meier 曲线分析显示高风险组患者的 RFS 更差(P = 0.023)。(B)GSE30219 队列中的 ROC 曲线分析。(C) GSE37745 年,Kaplan-Meier 曲线分析显示高风险组患者的 RFS 更严重(P = 0.0012)。(D) GSE37745 队列中的 ROC 曲线分析。ROC,接收者工作特征曲线;GEO,基因表达全集;RFS,即无复发生存。

生物途径与功能富集分析
鉴于 LUAD 患者自噬评分的预测价值令人满意,作者通过 GSEA 分析进一步探讨了 TCGA 队列中的潜在机制(见图 4)。上调的前三个 GO BP 术语是涉及这些通路的蛋白质:细胞周期 G2M 相变、细胞周期 G1S 相变和染色体分离,而前三个下调的 GO BP 术语分别是 T 细胞活化、适应性免疫反应和细胞间粘附调控。此外,前三个上调的 GO MF 项涉及参与这些通路的蛋白质:单链 DNA 结合、微管蛋白结合和对 DNA 的催化活性,而下调的 GO MF 项分别是细胞因子受体活性、被动跨膜转运蛋白活性、免疫受体活性和门控通道活性。此外,前三个上调的 GO CC 项是涉及这些通路的蛋白质:含复杂体的线粒体蛋白、凝聚染色体和染色体区域,而前三个下调的 GO CC 项分别是质膜外侧、顶端质膜和受体复合物。此外,KEGG 通路富集显示该有意义的自噬评分参与了切合体、细胞周期、细胞粘附分子凸轮和 p53 信号通路。

图 4。TCGA 队列中的 GSEA 富集分析。

(A) GO BP 对自噬评分的分析。(B)GO MF 自噬评分分析。(C) Go CC 对自噬评分进行分析。(D)KEGG 途径富集自噬评分。KEGG,《京都基因与基因组百科全书》;CC,蜂窝组件;MF,分子功能;BP,生物过程;基因本体学 GO;GSEA,基因集富集分析。

自噬评分与临床特征之间的相关性
在作者的研究中,进一步分析了自噬评分与临床特征之间的关系。自噬评分与年龄、性别和吸烟史无关(均为 P > 0.05,见图 S1)。作者发现自噬评分与 EGFR 突变状态无关(P = 0.73)。有趣的是,野生型 KRAS 患者的自噬评分较高(P = 0.017),而野生型 TP53 患者的自噬评分较低(P = 6.4e−11)。此外,作者构建了 TCGA LAUD 队列和第二湘雅医院正常肺组织与 LUAD 肿瘤组织的差异分析。作者发现保护基因 MAPT、MAP1LC3B 和 CALCOCO2 在两组中均显著下调(见图 5)。

图5。基因的差异表达分析构建了自噬评分。

(A)在 TCGA 队列中,肿瘤组织中 RAB1A、CHMP4B、VPS37D、RPS6KB1 和 GPR37 显著升高。PIK3CA、GRID2、TFEB、PTEN、PDK2、MAPT、PARK2、MAP1LC3B 和 CALCOCO2 在肿瘤组织中显著下调。BCL2L1、GOPC、CXCR3、GABBR2 和 TRIM8 在肿瘤与正常组织间表现出相似的表达水平。(B)第二湘雅医院 LUAD 患者中,CXCR3、MAPT、PARK2、TRIM8、MAP1LC3B 和 CALCOCO2 肿瘤组织表达较低。而其他基因在正常组织与肿瘤组织之间表达水平相似。**P < 0.01;P < 0.001。

自噬评分与免疫微环境相关
为了深入理解免疫微环境与复发风险之间的潜在联系,作者通过一系列分析方法探讨了它们的关系。首先,作者分析了自噬评分与不同免疫细胞之间的关联。本研究结果显示,自噬评分与前 B 细胞、Th1 细胞、Th2 细胞和巨噬细胞 M1 细胞呈正相关,但与 DC 细胞、肥大细胞、B 细胞、CD4+和 CD8+ T 细胞呈负相关(均为 P < 0.05,见图 6)。此外,作者还考察了自噬评分与免疫检查点分子(如 CD274、PDCD1LG2、ICOSLG、CD276、HHLA2、CTLA4 等)之间的关联。总体而言,高风险组 CD276 表达较高,而 HHLA2、C10orf54 和 NCR3 在低风险组中较高(均为 P < 0.05)。接着,作者通过估计算法计算免疫评分,发现自噬评分与免疫评分呈负相关(r = −0.14,P = 0.02)。 此外,自噬得分与 ESTIMATE 评分呈负相关,但统计差异较弱(r = −0.11,P = 0.06)。 自噬评分与基质评分之间似乎存在相关性,但未观察到统计学显著性(r = −0.068,P = 0.26)。

图6。自噬评分与免疫微环境的关联。

(A)与免疫细胞的关系。(B)与免疫检查点分子的关系。(C) 自噬评分与免疫评分相关(r = −0.14,P = 0.02)。(D) 自噬得分与基质得分无关系(r = −0.068,P = 0.26)。 (E) 自噬评分与估计值(ESTIMATE)相关性较弱(r = −0.11,P = 0.06)。

自噬评分预测化疗、靶向治疗和免疫治疗的总体生存率及治疗效果
在这项研究中,自噬特征很可能预测 LUAD 患者的复发。此外,作者还希望进一步探讨其是否能预测患者的整体生存率。有趣的是,高风险患者的手术时间均短于低风险患者,无论是 TCGA、GSE30219 GSE37745 队列(图 7,P < 0.0001,P = 0.00071 和 P = 0.0035)。 化疗和靶向治疗是治疗 LUAD 患者最常见的方法。作者利用 GDSC 数据库探讨了不同组间某些化疗和靶向治疗药物的潜在反应。值得注意的是,高风险组患者的奥沙利铂和环磷酰胺的 IC50 较低,表明高风险组患者对这些化疗药物更为敏感。此外,作者还发现高风险组患者对奥斯替尼(EGFR-TKI)、阿西替尼(VEGFR-TKI)、克里佐替尼(EML4-ALK 融合抑制剂)和 PRIMA-1MET(突变 p53 激活剂)的 IC50 较低,表明与低风险组相比,高风险组患者对这些靶向治疗药物的敏感性更高。近年来,免疫疗法正作为 LUAD 患者的重要治疗方法崭露头角。作者计算了 TIDE 分数,以预测两组患者的免疫治疗反应。有趣的是,结果显示低风险组患者的 TIDE 评分较低,这表明这些患者的免疫治疗反应更好。

图 7。自噬评分预测了闭塞性手术(OS)及化疗、靶向治疗和免疫疗法的疗效。

(A–C)TCGA(P < 0.0001)、GSE30219(P = 0.00071)和 GSE3774(P = 0.0035)队列自噬得分的总体生存分析。(D–I)两组之间估计的 IC50 为奥沙利铂(P = 0.044)、环磷酰胺(P = 0.023)、奥西替尼(P = 0.048)、阿西替尼(P = 0.011)、克里佐替尼(P = 0.0053)和 PRIMA-1MET(P = 2e−04)。(J) TIDE 分数与自噬分数的关系(P = 0.025)。(K) 两组免疫治疗反应率(P = 0.03475)。肿瘤免疫功能障碍与排除性疾病(TIDE);OS,整体生存。
 

总结

总之,作者建立了自噬基因相关风险模型,用于预测 I 期 LUAD 患者的复发,并通过外部验证队列进一步证明其准确性。此外,作者还发现了其在预测整体生存率方面的重要性,并初步探讨了其潜在的分子机制。更重要的是,作者发现该风险模型能够为化疗、靶向治疗和免疫治疗提供指导,从而为 LUAD 患者带来临床益处 。