|
导语
作者从已知研究中获得了代谢与基因之间的相互作用网络,包括 30,446 个边缘,并鉴定了 4,112 个 MPI 基因。通过泛癌分析,鉴定了 346 个 PAAD 肿瘤特异性代谢相关基因 ( Supplementary Table S1)。根据这些基因的表达水平,对 14 种泛癌类型进行主成分分析,显示前两个主成分 PC1 和 PC2。PAAD 样本形成不同的簇,明显与其他组织类型分开 ( Figure 1A)。接下来,对 14 种癌症类型进行 Cox 预后分析,揭示了所有癌症类型中预后基因的数量更多。PAAD 特异性代谢相关基因集的 GSEA 富集分析表明,这些基因在 PAAD 肿瘤类型中表现出最显着的富集 ( Figure 1B)。
PCA 和生存分析。(A) TCGA 和对照正常组织中 14 种肿瘤类型的主成分分析,不同的颜色表示不同的肿瘤类型。(B) 绿色:−log10P,PAAD 特异性代谢基因在 TCGA 中 14 种肿瘤类型的预后基因集的 GSEA 分析中的显着性水平。蓝色:log2TNG,预后相关基因集数(TNG,预后基因的总数)。(C) PAAD 肿瘤组织中 PAAD 特异性代谢基因 (MIPros) 表达水平的 PCA。(D) PCA 亚型组的生存分析。(E) PCA 亚型和临床特征的箱形图,包括年龄、肿瘤体重、HRD 评分和 TMB。独立验证数据集中 PAAD 特异性代谢基因 (MIPros) 和 PCA 亚型存活率的 PCA 分析:(F) PACA-AU、(G) GSE62452 和 (H)。 GSE21501
基于 PAAD 特异性代谢相关基因表达水平的主成分分析确定了两个主成分,PC1 和 PC2。根据方程 PC1 = 3PC2 将样本分为两种 PCA 亚型,样本量分别为 63 和 113 (Figure 1C)。生存分析显示两种 PCA 亚型之间存在显着差异 (p = 0.0038, Figure 1D)。此外,在两种 PCA 亚型之间观察到 HRD 评分和 TMB 的显着差异 ( Figure 1E)。
此外,在独立验证数据集 PACA-AUGSE62452 、 和 GSE215O1 中,作者根据 PC1 = 3PC2 将样本分为两组进行 PCA 分析。在 PACA-AU 和 GSE62452 数据集中观察到两种 PCA 亚型之间患者生存率的显着差异 ( Figures 1F, G)。在数据集中 GSE21501 ,虽然两种 PCA 亚型之间的生存差异没有达到显着性阈值,但观察到了分歧的趋势 ( Figure 1H)。
在 PCA 亚型中鉴定 MPI 相关基因并验证外部数据
作者对 TCGA-PAAD 的 PCA 亚型进行了差异表达分析,并鉴定了 2,165 个差异表达基因 (DEG) ( Supplementary Table S2)。两种 PCA 亚型中前 50 个基因的表达水平可视化,揭示了它们之间的显着差异 ( Figure 2A)。此外,这些基因中的大多数在独立验证数据集(PACA-AU, GSE62452 , GSE21501 ) ( ) 中表现出一致的差异表达模式 ( Figure 2B)。基于 STRING 蛋白相互作用网络,作者构建了前 50 个差异表达基因的 PPI 网络 ( Figure 2C; Supplementary Table S3)。
差异表达和 PPI。(A) 根据 PCA 亚型鉴定差异表达基因。红色表示 C1,蓝色表示 C2,基于 FC 值。(B) TCGA-PAAD 和独立验证数据集 (PACA-AU, GSE62452 , GSE21501 ) 中 PCA 亚型中前 50 个差异表达基因的差异表达。(C) 深绿色大点表示 PCA 亚型中的差异表达基因,而橙色小点表示在 PPI 网络中与它们相连的基因。
使用 WGCNA 鉴定与 PCA 亚型相关的关键模块
作者使用 R 包 WGCNA 对样本中表达水平波动前 50% 的基因进行加权相关网络分析 (WGCNA)。通过计算基因对之间的 Person 相关系数构建加权基因网络,通过相关值的幂计算确定软阈值。根据软阈值和平均连通性的分布图,作者选择了 power = 7 ( Figure 3A)。然后使用基因之间的相关系数构建分层聚类树,其中不同的基因模块由不同的分支和颜色表示。在这项研究中,基因被分为 20 个模块,每个模块中的基因数量如 Figures 3B, C所示。
PAAD 样本中基因表达水平的 WGCNA 分析。(A) 软阈值和平均连通性的分布图。横轴表示软阈值(功率),而纵轴表示无标度网络的评估参数。值越高,网络越符合无标度特征。(B) 分层聚类树显示每个模块。不同的颜色表示分组到不同模块中的基因,而灰色表示未分类到模块中的基因。(三、三) 模块基因与临床表型数据的关联分析。红色表示较大的正相关,而蓝色表示较大的负相关。
基于加权相关系数,根据基因的表达模式将基因分组到模块中。当将 PCA 亚型作为临床特征时,相关性分析显示 Black 模块与 PCA 亚型表现出很强的正相关 (R2 = 0.53,p = 2.0E-14),并且还 与 OS 状态相关 (R2 = 0.25,p = 9.0E-04; Figure 3D)。因此,本研究选择了 Black 模块进行下游分析。
基于 MPI 相关基因和关键模块基因的 MPI 评分模型构建
在已识别的关键模块 Black 中包含的基因与 PCA 亚型 ( ) 的差异表达基因之间进行交Figure 4A集。使用单变量 Cox 回归模型,以 ≤ 0.5 的阈值确定预后因素 ( Supplementary Table S4),并通过 LASSO-logistic 回归去除冗余因素,以进一步细化预后因素的选择。结果表明,当模型包括 9 个预后因素时,该模型实现了最佳效率。因此,作者选择了这 9 个因素进行后续分析:ANLN、PKMYT1、HMGA1、CEP55、FAM83A、FOSLl、GJB5、KRT6A 和 ANXA8 ( Figures 4B, C)。
(A) PCA 亚型中的差异表达基因与 WGCNA 分析中 Black 关键模块基因的交集。(B) LASSO 回归的路径图说明了模型中因子的系数如何随不同的 λ 值而变化。(C) 模型的 λ 值通过 10 倍交叉验证确定,最终选择 9 个预后因素。根据中位 MPI 评分将患者分为高 MPI 组和低 MPI 组。(D) Cox 比例风险模型分析评估了 9 个预后因素的预后效果。风险比 (HRs) 和相应的置信区间表示每个因素对患者生存的独立影响,HRs 大于 1 表示风险增加,HR 小于 1 表示具有保护作用。该分析突出了 MPI 评分相对于其他因素的稳健预后价值。(E),使用 TCGA-PAAD 数据构建的 MPI 评分模型中高低 MPI 评分组的生存分析。(F-H)KM 曲线验证了 MPI 评分模型在独立数据集 PACA-AU GSE62452 、 和 GSE21501 中的预后疗效。(I) TCGA 数据集和独立验证数据集中的单变量 Cox 回归分析。(J) 多变量 Cox 回归分析,根据年龄、性别和肿瘤分级等临床因素进行调整。(K) TCGA 数据集中的多变量 Cox 回归分析,根据包括年龄、性别和肿瘤分级在内的临床因素进行调整。(L) TCGA 数据集和独立验证数据集中 MPI 评分模型在不同生存时间的 AUC 值的 ROC 曲线分析。(M) TCGA 数据集和独立验证数据集中不同模型的 C 指数。 **p ≤ 0.01。
Cox 回归分析证实,所有 9 个预后因素都与风险因素增加相关 (HR ≥1,p ≤ 0.05; Figure 4C)。为了评估这些预后因素对患者生存的集体影响,根据它们的表达水平和 Cox 回归系数构建了预后评分模型。然后计算每个样本的 MPI 评分 ( Figure 4D)。
为了评估 MPI 评分模型的预后疗效,根据中位 MPI 评分将样本分为两组。观察到组间生存 OS 存在显着差异 (Figure 4E)。此外,分析了独立的验证数据集(PACA-AU GSE62452 和 GSE21501 ) 以确认 MPI 评分模型的预后准确性。KM 生存曲线显示 MPI 评分高和低的患者之间的生存时间存在显着差异 ( Figures 4F–H)。这些发现与 TCGA-PAAD 数据集的结果一致。
此外,在TCGA 数据集和独立验证数据集 PACA-AUGSE62452 和 GSE21501 中评估了 MPI 评分模型的预后疗效。单变量 Cox 回归分析确定 MPI 评分是患者生存的重要危险因素 ( Figure 4I)。在调整了年龄、性别和肿瘤分级等临床因素后,多变量 Cox 回归分析证实 MPI 评分仍然是这些数据集中的独立预后因素 ( Figure 4J)。具体来说,在 TCGA-PAAD 数据集中,多变量 Cox 回归分析表明 MPI 评分是一个独立的预后因素 (HR = 1.04 [95% CI,1.01-1.1];p = 0.002; Figure 4K)。此外,不同时间点的 ROC 曲线分析表明该模型具有较强的预后性能 ( Figure 4L)。还评估了 C 指数的单独 MPI 评分、单独的临床因素及其组合。值得注意的是,MPI 评分和临床因素模型的组合在数据集中表现出最高的 C 指数 ( Figure 4M)。
进行统计测试以检查 MPI 评分与 TCGA-PAAD 样本中各种临床特征之间的相关性。在不同 TNM 分期、吸烟/饮酒状况、性别和年龄的患者中未观察到 MPI 评分的显着差异 (Supplementary Figure S1)。然而,在肿瘤分级、慢性胰腺疾病状态以及 TP53 和 KRAS 突变状态方面发现显著差异 ( Figure 5A)。
(A) TCGA 数据集中 MPI 评分在不同临床特征组中的箱线图分布。使用 Wilcoxon 秩和检验确定两组间比较,使用 Kruskal-Wallis 检验确定多组间比较。(B) GSEA 用于分析 MPI 评分组的功能富集,包括 BP、CC、MF 和 KEGG 通路。横轴表示标准化富集评分 (NES),其中小于 0 的值表示低 MPI 评分组的富集,而大于 0 的值表示高 MPI 评分组的富集。虚线表示 FDR = 0.05。(C) 跨 PCA 亚型 MPI 评分的箱形图。(D-F)MPI 评分与免疫评分、干度指数和肿瘤纯度之间的相关性分析。Wilcoxon 秩和检验用于确定箱形图的显着性水平,而 Spearman 秩相关性应用于散点图。(G) 描述 MPI 评分组和 ICB 因子表达水平的箱形图。(H) 显示 MPI 评分组和 HLA 家族基因表达水平的箱形图。*p ≤ 0.05;**p ≤ 0.01;p ≤ 0.001;ns,不显著。(I) MPI 评分与 ICB 因子和 HLA 家族基因表达之间的相关性分析。
作者根据中位 MPI 评分对 PAAD 样本进行分组。使用差异表达基因的 log2FC 值作为有序基因集,对 GO 生物过程和 KEGG 通路进行 GSEA 分析。结果使用火山图 ( Figure 5B)可视化。例如,GO BP 项 MEIOTIC_CELL_CYCLE 在高 MPI 评分组中显著富集 ( Figure 5B),而 KEGG 通路 NEUROACTIVE LIGAND_RECEPTOR_INTERACTION 在低 MPI 评分组中显著富集 ( Figure 5B)。
作者分析了不同 PCA 亚型 MPI 评分的分布,发现 C2 患者的 MPI 评分显著高于 C1 患者 (p = 1.8E-08; Figure 5C)。此外,MPI 评分与肿瘤纯度和干性指数呈显著正相关,在高 MPI 评分组和低 MPI 评分组之间观察到显著差异 ( Figures 5D, E)。此外,MPI 评分和免疫评分之间存在显著的负相关,高 MPI 评分组和低 MPI 评分组之间存在显著差异 ( Figure 5F)。
作者探讨了 ICB 和 HLA 家族基因表达水平在 MPI 评分低和高组中的分布。对于 ICB 表达水平,高 MPI 评分组和低 MPI 评分组的患者之间未发现显著差异 ( Figure 5G)。然而,某些 HLA 家族基因在表达上表现出显着差异 ( Figure 5H)。此外,线性相关分析显示 MPI 评分与 ICB 因子和 HLA 家族基因表达水平之间存在显著的正相关 ( Figure 5I)。
作者从 TIMER2.0 数据库下载了不同的方法,包括 TIMER、CIBERSORT、xCell 和 EPIC,以计算 TCGA-PAAD 样本中的免疫浸润水平并构建免疫景观。应用 Wilcoxon 秩和检验来检查 MPI 评分组与免疫浸润水平之间的相关性。一些免疫细胞在高和低 MPI 评分样本之间表现出显着不同的浸润水平 ( Figure 6A)。此外,使用 FPKM 表达谱数据,作者使用 R 包 CIBERSORT 计算了 22 种免疫细胞类型的浸润评分,揭示了高 MPI 评分组和低 MPI 评分组之间的显着差异 ( Figure 6C)。
(A) MPI 评分组和免疫细胞浸润水平的热图,包括 TIMER、CIBERSORT、xCell 和 EPIC。(B) 高 MPI 评分组和低 MPI 评分组的基因组突变图谱,显示按突变频率排名的前 30 个突变基因。(C) MPI 评分和基于 CIBERSORT 的免疫细胞浸润水平的箱形图。使用 Wilcoxon 秩和检验确定统计显着性水平。(D) 高 MPI 评分组和低 MPI 评分组中排名靠前的突变基因的变化频率,字母大小代表突变频率。TP53 基因在高 MPI 评分组和低 MPI 评分组中的突变位点。(E) MPI 评分与总突变计数、非同义突变计数、同义突变数量和肿瘤突变负荷 (TMB) 之间的相关性。(F) 突变频率高的基因突变状态和总生存期 (OS) 时间的 Cox 回归分析。(G) PAAD 中顶级突变基因的共突变分析。在该图中,绿色表示突变在统计学上显着的共发生,表明在肿瘤进展或免疫微环境调节方面具有潜在的合作作用,而棕色表示相互排他性,表示替代致癌途径。*p < 0.05。**p ≤ 0.01;p ≤ 0.001;ns,不显着。
此外,作者使用 R 包 MAfTools 来识别突变频率最高的前 30 个基因,并检查它们在高 MPI 评分组和低 MPI 评分组中的分布 ( Figures 6B, D)。然后应用 Fisher 精确检验来评估两组之间突变频率的差异,在高 MPI 评分组中鉴定出 16 个变异频率显著不同的基因 ( Supplementary Table S5)。例如,TP53 突变在低 MPI 评分组中更为普遍 (p = 1.67E-06, Figures 6B, D)。对于所有突变,作者发现与 MPI 评分 ( Figure 6E)呈显著正相关,高 MPI 评分组的突变总数显着更高 ( Figure 6E)。在非同义突变和同义突变中观察到类似的趋势( Figure 6E)。此外,高 MPI 评分组 ( Figure 6E)的 TMB 显著升高,进一步表明与 MPI 评分呈正相关 ( Figure 6E)。
根据从高到低排列的突变频率,作者选择了前 200 个突变基因。然后对突变状态进行单变量 Cox 回归分析,确定了 21 个与预后相关的突变基因 ( Figure 6F)。此外,前 30 个高频突变基因的共突变分析揭示了某些基因中显着的共突变模式 ( Figure 6G)。
肿瘤代谢相关通路的 GSEA 分析显示,TCGA-PAAD 数据集和验证集 RACA-AU 和GSE62452 () 的结果 Supplementary Figure S2一致。值得注意的是,在所有三个数据集的高 MPI 评分样本中,Folate_biosynthesis 和 Glycosaminoglycan_biosynthesis_keratan_sulfate 通路在高 MPI 评分样本中显著富集,而 Fatty_acid_metabolism 通路在低 MPI 评分样本中显著富集。
此外,下载来自 GDSC 的药物基因组学数据,并根据细胞系表达数据和药物反应信息应用岭回归预测患者的药物敏感性 (Supplementary Table S6)。还探讨了高低 MPI 评分组与药物反应模式之间的相关性 ( Supplementary Table S7)。作者发现,对于一些抗癌药物,MPI 评分高的患者对药物反应更敏感,例如阿法替尼 ( Figure 7A)。相反,对于依托泊苷、多柔比星和吉西他滨,MPI 评分低的患者对药物反应更敏感 ( Figure 7A; Supplementary Table S7)。
条形图显示了 PAAD 样本的高 MPI 评分组和低 MPI 评分组中通过 Ridge 回归预测的药物敏感性。红色表示药物在高 MPI 评分组中的电敏感度更高,而蓝色表示在低 MPI 评分组中的敏感性更高。筛选条件为 |Δlog2(IC50)≥ 0.1,FDR ≤ 0.05。(二 、 三)TCGA 样本中 MPI 评分和 TIDE 预测评分之间的 Spearman 相关性,用箱线图表示。(D,E)MPI 评分和 TIDE 预测评分之间的 Spearman 相关性,以及 PACA-AU 数据集中的箱形图表示。(女 , 克)MPI 评分和 TIDE 预测评分之间的 Spearman 相关性, GSE62452 数据集中具有箱形图表示。(H, 我)MPI 评分和 TIDE 预测评分之间的 Spearman 相关性, GSE21501 数据集中具有箱形图表示。(J) IMvigor 210 队列中免疫治疗治疗样本的生存分析,比较高 MPI 评分组和低 MPI 评分组。(K) 高 MPI 评分组和低 MPI 评分组中免疫治疗反应的比例。(L) 使用 Wilcoxon 秩和检验评估反应/无反应与 MPI 评分之间的相关性。
作者在 TCGA-PAAD 数据集和验证集 PACA-AU、 GSE62452 和 GSE21501 ( Supplementary Tables S8- S11)中预测了免疫治疗的 TIDE 评分。还分析了 MPI 评分和 TIDE 评分之间的相关性,揭示了三个验证数据集中的正相关 ( Figures 7B, D, F)。例如, GSE62452 显示出最强的正相关 (R2 = 0.43,p = 2.4E-04, Figure 7F)。此外,高 MPI 评分组的患者在所有三个数据集中均具有显着更高的 TIDE 评分 ( Figures 7C, E, G)。然而,在 GSE21501 中,相关性没有达到统计学意义 ( Figures 7H, I)。
为了探索 MPI 评分是否可以用作免疫治疗反应标志物,使用 R 包 IMvigor210CoreBiologies 从接受 PD-L1 阻滞剂 atezolizumab 治疗的患者中提取一组转录组学和临床数据,用于验证分析。发现高 MPI 评分与更好的治疗后结果相关 (p = 0.012, Figure 7J)。此外,高 MPI 评分组和低 MPI 评分组之间对 atezolizumab (CR/PR) 有反应的患者比例相似 (高 MPI 评分:22.5%;低 MPI 评分:23.1%; Figures 7K, I)。
此外,作者在体外研究了 anillin (ANLN) 在 BxPC-3 细胞中的功能意义。作者生成了 anillin 敲低 (siRNA1 和 siRNA2) 人 BxPC-3 细胞,并使用 Western blotting 分析来确认敲低效率 ( Figure 8A)。EMT 过程被广泛认为是癌症进展的关键因素 ( 33 )。因此,作者评估了与 EMT 相关的蛋白质水平 ( Figure 8A)。研究结果显示,在苯油素敲低的 BxPC-3 细胞中,E-钙粘蛋白增加,N-钙粘蛋白、波形蛋白、蜗牛和 TGF-β 减少,表明油香素可能在促进 EMT 过程中发挥重要作用。为了检查芳香素对增殖的影响,作者进行了 EdU 脉冲标记,结果显示芳香素敲除细胞中的芳香素增殖能力显著降低 (p < 0.001) ( Figure 8B)。接下来,进行 Transwell 测定以评估迁移和侵袭能力 (p < 0.001) ( Figure 8C),显示芳荷素敲除 BxPC-3 细胞中的迁移和侵袭显着减少。此外,进行试管形成测定以评估芳香素对血管生成的影响,芳荷素敲除细胞中的血管生成显著降低 (p < 0.001) ( Figure 8D)。总的来说,这些发现表明芳香素在促进肿瘤进展的多个方面起着至关重要的作用,包括 EMT、迁移、侵袭和血管生成。
Anillin 促进 BxPC-3 细胞的上皮-间充质转化 (EMT)、增殖、迁移、侵袭和血管生成。(A) Western blot 分析证实了 anillin (ANLN) 在转染 siRNA1 和 siRNA2 的 BxPC-3 细胞中的敲低效率。敲低 anillin 导致 E-cadherin 水平升高,N-cadherin、Vimentin、Snail 和 TGF-β 的表达降低,表明 EMT 过程受到抑制。(A) EdU 掺入试验显示,与对照组相比,anillin 敲低 BxPC-3 细胞的增殖显着减少 (p < 0.001)。(C) Transwell 迁移和侵袭试验显示苯醛敲除 BxPC-3 细胞的迁移和侵袭能力显着降低 (p < 0.001)。(D) 试管形成试验显示苯醛敲除后血管生成电位显著降低 (p < 0.001)。所有实验一式三份进行,并使用适当的测试确定统计显着性 (p < 0.001)。p < 0.001
总结
本研究中提出的 MPI 评分系统是影响患者生存的独立预后因素,可有效反映胰腺癌患者的免疫浸润水平、抗癌药物敏感性和免疫治疗反应。它是研究代谢重编程在胰腺癌中的作用和治疗影响的有前途的临床标志物。
|