导语

结果:

通过 WGCNA 分析鉴定 CAF 标记基因
使用 TCGA 队列的 803 例 NSCLC 样本进行 WGCNA 分析,以寻找 CAF 相关基因。根据中位绝对偏差从 19,710 个蛋白质编码基因中选出前 5000 个基因。样本聚类后,作者通过将 cutHeight 设置为 8000 排除了 19 个异常值。最终,784 个样品用于共表达网络构建。根据图 S2a 选择软阈值 (β = 4) 和无标度 R2 (0.86)。接下来,作者使用 cutreeDynamic 函数确定了 33 个共表达模块。通过 Pearson 检验评估 CAF 浸润分数和模块之间的相关性。作者发现红色模块与通过 EPIC 、 MCP 计数器和 xCell 算法计算的 CAFs 丰度的相关性最高。红色模块中的模块隶属关系与 EPIC-CAFs、MCP-counter-CAFs 和 xCell-CAFs 的基因显著性之间的相关系数分别为 0.96、0.97 和 0.65(p < 0.05)。GO 和通路分析显示,红色模块中的基因参与与细胞外基质组织、血管生成和上皮-间质转化相关的生物过程。因此,选择包含 277 个基因的红色模块作为 CAF 标记基因选择的关键模块。

基于 CAF 的风险模型的构建与验证
GSE41271具有 PFS 和 OS 预后信息的队列用作训练集,构建基于 CAF 的风险模型,其中红色模块中的 CAF 标记基因和先前报道的经典 CAF 标记 [8]。首先,根据单变量 Cox 比例回归分析与 OS 显着相关的 29 个 CAF 制造基因被纳入 LASSO 分析以缩小范围。然后,从 LASSO 分析中选择 7 个基因,在评估比例风险假设后仅剩下 5 个基因 (FBLIM1 、 LAMC2 、 NDN 、 SEMA3C 、 SLC39A14 、 p > 0.05)。这五个 CAF 标记基因之间的相关性如图 S3c 所示。根据中位截断值 = 2.01527,将训练集中的 274 例患者分为高分组 (n = 137) 和低分组 (n = 137)。作者发现,高分患者的 OS 比低分患者差 (HR = 2.31,95%CI:1.59–3.34,p < 0.0001)。风险评分和生存状态的分布以及 5 个 CAF 特征在两组之间的表达水平如图 所示。ROC 以说明风险模型的预后有效性。2 年和 4 年时曲线下面积 (AUC) 分别为 0.64 和 0.67。此外,根据 CAF 特征,高分患者的 PFS 低于低分患者。

为了验证基于 CAF 的风险模型的预测性能,使用微阵列检测到的两个独立 GEO 数据集作为验证队列。使用上述公式计算每个样本的风险评分,截断值与训练队列的截断值相同。Kaplan-Meier 结果和 ggrisk 图表明,高分患者的 OS 短于 GSE37745 分低的患者 (HR = 1.63,95%CI:1.17-2.28,p = 0.0037) 和 GSE42127 (HR = 2,95%CI:1.22–3.27,p = 0.0059)。此外,还纳入了来自 TCGA 队列中进行 RNA-seq 分析的患者,以验证风险模型的预后预测能力。结果显示,尽管 Kaplan-Meier 曲线交叉发生在 5 年后,但大多数高分患者的 OS 低于低分患者 (HR = 1.26,95%CI:1-1.59,p = 0.048)。
根据 GSE41271 和 GSE42127 数据集,高分组肿瘤分期分布与低分组差异显著。结果表明,高分患者比低分患者表现出更晚期的肿瘤进展。为验证基于 CAF 的风险评分是否是 OS 的独立预后特征,在通过单因素 Cox 回归分析筛选重要危险因素后进行多因素 Cox 回归分析。CAF 评分在 GSE41271 中显示为独立危险因素 (HR = 2.06,95%CI:1.42–2.98,p < 0.001)、GSE37745 (HR = 1.60,95%CI:1.15–2.23,p = 0.0056) 和 GSE42127 数据集 (HR = 1.78,95%CI:1.08–2.95,p = 0.0249),除了 TCGA 队列 (HR = 1.2,95%CI:0.928–1.56,p = 0.1618)。因此,作者进行了一项荟萃分析来计算这四个队列的汇总 HR。结果显示,基于 CAF 的风险评分是 NSCLC 患者的独立预后因素 (HR = 1.58,95%CI:1.22-2.03,p < 0.001)。
由于 LUAD 具有与 LUSC 不同的肿瘤微环境,作者比较了来自四个队列的 LUAD 和 LUSC 患者的风险评分。结果表明,LUSC 中的 CAF 特征高于 LUAD 中的 CAF 特征。为了研究基于 CAF 的风险模型是否在 LUAD 和 LUSC 中均具有预后疗效,作者分别对四个队列的 LUAD 和 LUSC 患者进行了生存分析。“survminer”包中的“surv_cutpoint”函数用于计算每个队列中风险评分的临界值。结果表明,基于 CAF 的风险评分在 LUAD 和 LUSC 患者中均具有预后预测能力,但在 TCGA 队列的 LUSC 患者中的预测性能略弱。这可能是 TCGA 队列中风险评分预测能力较弱的原因。
CAF 评分与 CAF 浸润之间的相关性
以前的研究报道了几种计算算法,这些算法可以使用大量RNA-seq数据来指示成纤维细胞的丰度[26–28]。然而,EPIC-CAF 评分、MCP-counter-CAF 评分或 x Cell-CAF 评分似乎与患者的预后无关。它表明 CAFs 的传统浸润分数可能不是 NSCLC 患者的预后因素。相比之下,根据作者的结果,几个特定的 CAF 相关基因的表达会影响患者的预后,例如 FBLIM1 、 LAMC2 、 NDN 、 SEMA3C 和 SLC39A14。
为了研究基于 CAF 的风险评分与经典 CAF 标志物之间的相关性,使用先前研究中报道的 24 个经典 CAF 标志物在 TCGA 数据集上进行了表达谱聚类 [8]。热图显示,大多数经典 CAF 标志物在高分组中高度表达。同时,根据 EPIC 和 MCP 计数器算法,高分患者的成纤维细胞丰度高于低分患者。同样,与 GSE37745 中的低分组相比,高分组的 MCP-counter-CAF 评分更高。

在以前的研究中,报道了两种不同的 CAF 亚型,即肌纤维母细胞型 CAFs (myCAFs) 和炎性 CAFs (iCAFs) [37]。myCAF 表达高水平的 αSMA,而 iCAF 表达低水平的 αSMA 和高水平的细胞因子和趋化因子 [37]。比较了高分组和低分组从先前研究中筛选的 84 个 iCAF 标志物和 16 个 myCAF 标志物的表达 [38]。使用三个队列中显著差异表达的基因进行表达谱聚类。结果显示,大多数 myCAF 标志物在高分组中高表达,POSTN 的表达水平与 TCGA、GSE37745 和 GSE41271 数据集中基于 CAF 的风险评分呈正相关。此外,iCAF 标志物 S100A10、ANXA1、TNFAIP6、MYC、CXCL1、MT1X 和 MT2A 在三个队列的高分组中高表达,而 ADH1B、PLAC9 和 ITM2A 在低分组中高表达。
CAF 评分与肿瘤免疫微环境 (TIME) 的相关性
作者进行 ESTIMATE 分析以计算高分组和低分组的免疫评分。结果显示,在 TCGA 和 GSE41271 队列中,与低分组相比,高分组的免疫评分较低,表明高分组的免疫细胞浸润较低。TCGA 队列中的 CIBERSORT 结果表明,高分患者的 CD8 T 细胞和活化 NK 细胞比例较低,但静息 NK 细胞浸润较高。它表明基于 CAF 的风险评分与 TIME 中细胞毒性细胞的丰度呈负相关。同样,28 种免疫细胞类型的 ssGSEA 结果显示,基于 CAF 的风险评分与活化的 CD8 T 细胞浸润呈负相关。此外,与低分组相比,高分组活化 B 细胞、效应记忆 CD8 T 细胞、未成熟 B 细胞和 T 滤泡辅助细胞的浸润分数较低。虽然主要产生免疫调节细胞因子的 CD56brightNK 亚群在高分组中高表达,但在 TME 中起细胞毒效应作用的 CD56dimNK 亚群的浸润在高分组中减少,这与 CIBERSORT 分析的结果一致。总的来说,上述数据显示高分组细胞毒性免疫细胞的浸润较低。

为了研究 CAF 特征与免疫相关通路之间的联系,作者进一步在三个数据集中进行了 GSVA 分析。结果显示 CAF 评分与 CD4 阳性 α-β T 细胞活化呈负相关。低分组富含与 MHC 蛋白复合物活性和体液免疫反应相关的生物通路。这些发现表明,与高分组相比,低分组具有更活跃的免疫反应。由于既往研究表明基质成纤维细胞释放的 TGFβ 可以通过减弱免疫细胞的抗肿瘤功效来促进肿瘤进展,因此作者进一步探讨了 CAF 评分与 TGFβ 相关通路之间的关联 [17]。GSVA 分析显示风险评分与 TGFβ 信号激活呈正相关。它表明 CAFs 产生 TGFβ 可能会导致高分组出现免疫抑制环境和不良预后。据报道,胰岛素样生长因子 (IGF) 信号转导与肺癌高度相关 [39]。在作者的研究中,参与 IGF 信号传导的通路在高分患者中收敛。此外,标志性基因集分析显示 EMT 通路在高分组中显著富集。然后,作者分析了来自 TCPA 的 LUAD 和 LUSC 的蛋白质阵列数据,并验证了高分组表达高水平的间充质标志物纤连蛋白和低水平的上皮生物标志物,如 HER3 和 claudin-7。促进肿瘤代谢的信号通路,包括糖酵解、脂肪酸氧化和谷氨酰胺转运,在高分组中也很占主导地位。
之前的一项研究从 TCGA 数据库中确定了 33 种不同癌症类型的 6 种免疫亚型:伤口愈合 (C1)、IFN γ显性 (C2)、炎症性 (C3)、淋巴细胞耗竭 (C4)、免疫平静 (C5) 和 TGF β显性 (C6) [34]。为了表征高分组和低分组的肿瘤内免疫状态,作者基于这种免疫分型方法分析了每个样本的免疫亚型。具有高 CAF 特征的患者富含伤口愈合和 TGF-β 显性亚型,而具有低 CAF 特征的患者富含 IFN γ显性、炎症和淋巴细胞耗竭亚型。据报道,C1 亚型 (伤口愈合) 增殖率升高,Th2 细胞浸润率较高。与免疫亚型的结果一致,作者的分析显示高分组具有高增殖率和 Th2 细胞偏倚。同样,由于 C2 亚型中 TCR 多样性最大且 CD8 信号强(IFN-γ 显性)和 C3 亚型中 Th17 和 Th1 基因的表达升高(炎症),作者发现低分组中 TCR Shannon/TCR 丰富度指数较高,CD8 T/Th1/Th17 细胞浸润增加。据报道,高 TCR 多样性与免疫治疗反应更好相关 [40]。此外,与 GSVA 分析的结果一致,与低分组相比,高分组具有更高的 TGFβ 反应(C5 亚型)。总体而言,作者发现具有高 CAF 特征的患者具有高 TGFβ 特征、激活的 EMT 和免疫抑制环境。由于成纤维细胞释放的 TGFβ 可以通过产生免疫抑制 TIME 和诱导 EMT 来促进癌症进展,因此作者假设 CAF 释放的高水平 TGF β 是高分组 EMT 和免疫抑制的关键原因。
高分患者对免疫治疗反应不佳
基于上述证据,高 CAF 评分患者的 TIME 抑制性 CD8 T 细胞浸润率低,作者推测高分组对 ICBs 治疗的反应往往较差。由于实体瘤中的体细胞突变与免疫治疗之间存在密切关联,作者使用 TCGA 数据库中的基因组学分析探索了两个 CAF 亚组的突变景观。虽然两个亚组中前 10 个改变的基因大致相同,但高分组的 TP53 和 TTN 突变率与低分组相比显著增加。然后,作者比较两组之间的 TIDE 评分、 T 细胞功能障碍评分和 T 细胞排斥评分,以预测他们对免疫治疗的反应。TIDE 评分越高表明免疫治疗后的临床疗效越差。结果显示,高分组的 TIDE 和 Exclusion 评分较高,但功能障碍评分较低,表明对免疫治疗的反应不佳。此外,作者根据 TIDE 算法进一步验证了高分组 CD8 表达降低和 CAF 表达增加。

接下来,作者研究了基于 CAF 的风险模型在接受免疫治疗治疗的 NSCLC 队列中的预后疗效。由于每个队列的样本量有限,作者使用 R 包 “combat” (GSE126044 和 GSE135222) 收敛了两个 NSCLC 免疫治疗队列的表达数据。通过上述公式计算出每位患者的风险评分后,作者根据中位数将 43 名患者分为高分和低分组。Kaplan-Meier 曲线显示,抗 PD1/PD-L1 治疗后,高分患者的 PFS 低于低分患者(p = 0.015)。时间依赖性 ROC 的 AUC 范围为 0.62-0.71。然后,作者比较了 GSE126044 队列中高分组和低分组之间的 OS,因为只有这些患者有 OS 信息。结果显示,高风险评分与免疫治疗后短 OS 相关 (p = 0.064)。高分组和低分组之间的反应率分别为 14% 对 45%(3/21 对 10/22,p = 0.03)。此外,为了研究 CAF 特征与其他肿瘤免疫治疗疗效之间的关系,作者使用 GSE78220 数据集中 27 名黑色素瘤患者的转录组学和治疗反应数据进行了生存分析。虽然没有统计学上的显着差异,但与高分组相比,作者观察到低分组的反应者更多 (9/14 vs. 5/13,p = 0.18 )。这些发现验证了基于 CAF 的风险评分与对免疫治疗的反应相关。
为了进一步阐明临床反应差异的潜在机制,作者进行了 CIBERSORT 和 ssGSEA 分析,以比较两个 CAF 亚组之间的免疫细胞浸润景观。作者观察到风险评分与 CD8 T 细胞和 γδT 细胞的丰度呈负相关。同样,ssGSEA 结果表明,高风险评分的患者活化 CD8 T 细胞、效应记忆 CD4 T 细胞和未成熟 B 细胞的比例较低。然后,作者使用 GSVA 分析分析了 CAF 评分与免疫相关通路之间的关联。与 T 细胞活化、NK 细胞介导的肿瘤细胞免疫反应、树突状细胞抗原加工和呈递、通过 MHC 类的抗原加工和呈递以及体液免疫相关的基因集在低分组中显著富集。与 IGF 和 TGFβ 活性相关的通路在高危组中显著富集。随后,在两个风险亚组中计算 TIDE 评分 。高分患者的特征是 T 细胞功能障碍评分显著降低,T 细胞排除评分升高。正如预期的那样,CAF 特征与 CD8 呈负相关,与 CAF 表达呈正相关。总的来说,作者的研究结果表明,高分患者的免疫治疗效果较差,CD8 T 细胞浸润率低,T 细胞排斥评分高。为了进一步为高分组提供可行的治疗方案,作者基于 R 包 “oncoPredict” 估计了两组对化疗药物和靶向药物的敏感性。半数最大抑菌浓度 (IC50) 用于指示对药物的敏感性。结果显示,高分组患者对化疗药物和表皮生长因子受体酪氨酸激酶抑制剂 (EGFR-TKIs) 更敏感,表明他们可能受益于化疗或靶向治疗而不是免疫治疗。然后,利用 Connectivity Map 数据库预测两组的潜在治疗药物。作者还发现,根据 cMap 结果,EGFR 抑制剂对高分组有效。此外,PI3K 抑制剂、 HDAC 抑制剂和 mTOR 抑制剂等药物对高分组显示出潜在的抗癌作用。靶向 NF-kB 通路和微管蛋白的药物在低分组中显示出潜在的治疗效果。
scRNA-seq 分析显示 CAF 是 NSCLC 中产生 FBLIM1 的主要来源
在这里,作者试图研究作者的 CAF 风险模型中的 5 个基因是否主要在基质 CAFs 中表达。比较了 scRNA-seq 数据集 GSE131907 中 10 种细胞类型的 5 个基因的表达水平。作者注意到 FBLIM1 和 NDN 主要在成纤维细胞中表达。与正常组织的成纤维细胞相比,FBLIM1 在 CAFs 中显著上调。同样,作者还使用来自 GEPIA2021 位点的大量 RNA-seq 数据观察到 LUAD 和 LUSC 肿瘤组织的 CAFs 中 FBLIM1 水平较高(。因此,作者随后关注了 FBLIM1 在 CAF 中的作用。作者进一步验证了 FBLIM1 主要在三个额外的 NSCLC 单细胞数据集以及来自 TISCH 网络资源的其他肿瘤的多个数据集中以 CAFs 表达。此外,FBLIM1 表达与经典 CAF 标志物表达之间的正相关也表明 FBLIM1 与 CAFs 密切相关,CAF 是 FBLIM1 在 NSCLC 中表达的主要来源。

单细胞 RNA 测序的使用增强了作者对 CAF 异质性的理解。在胰腺癌、结直肠癌、乳腺癌和肺癌中已鉴定出几个 CAF 亚群 [8, 41]。在这项研究中,作者使用 UMAP 算法将 CAF 分为 11 个子集群。作者观察到来自亚簇 0-5、7 和 9-10 的 CAFs 高度表达 FBLIM1,而来自亚簇 6 和 8 的 CAFs 几乎不表达 FBLIM1。因此,作者根据 FBLIM1 的表达将 CAF 分为两个亚型:FBLIM1 阳性 CAF 和 FBLIM1 阴性 CAF。为了探讨两种 CAFs 亚型之间的生物学功能差异,作者对两组进行了差异表达分析。FBLIM1 阳性 CAFs 中排名前 10 位的上调基因是 COL1A1、COL3A1、ACAT2、COL1A2、TAGLN、FN1、COL6A3、TPM2、MMP11 和 COL6A2 。它们中的大多数与细胞外基质合成密切相关。此外,基于作者假设 CAFs 释放的 TGFβ 导致高分组的 EMT 和免疫抑制,作者进一步研究了 TGFB1 在两种亚型中的表达。正如预期的那样,与 FBLIM1 阴性 CAF 相比,TGFB1 在 FBLIM1 阳性 CAF 中高表达。从 TCGA 批量 RNA-seq 数据中,在 LUAD 和 LUSC 中也观察到 FBLIM1 和 TGFB1 表达之间的正相关。使用 FBLIM1 阳性 CAFs 和 FBLIM1 阴性 CAFs 之间的差异表达基因进行 GSEA 分析。结果显示,FBLIM1 阳性 CAFs 中上调的基因富集于与上皮-间充质转化、黏着斑、血管生成和对 TGFβ 的反应相关的通路中,而下调的基因富集在与 NK 细胞介导的细胞毒性、淋巴细胞介导的免疫、FC 受体信号通路和抗原结合相关的通路中,表明 EMT 和 TGFβ 信号激活,但 FBLIM1 阳性 CAFs 中的免疫反应降低。FBLIM1 在 CAF 亚型中的分布与经典的 CAF 标志物 ACTA2、S100A4 和 FAP 不同。为了探索 CAFs 与肿瘤微环境中其他细胞类型之间的细胞间相互作用,作者使用 “CellChat” 的 R 包进行了细胞间通讯分析。配体受体分析显示,FBLIM1 阳性 CAFs 通过 LGALS9-CD45 和 LGALS9-CD44 配体-受体对与 B 淋巴细胞、T 淋巴细胞、NK 细胞和骨髓细胞相互作用,而 FBLIM1 阴性 CAFs 没有表现出这种相互作用。先前的一项研究报道,半乳糖凝集素-9 (Gal-9, LGALS9) 和 CD44 的结合通过扩增 TGFβ 信号传导和增强 Foxp3 的表达和稳定性来增加 Treg 细胞的免疫抑制作用 [42]。这一结果与作者关于 FBLIM1 阳性 CAFs 中 TGFβ 信号通路激活和免疫抑制表型的发现一致。此外,据报道,Gal-9 和 CD45 的结合与 B 细胞受体信号传导的抑制有关 [43]。研究还发现,介导FBLIM1阳性CAFs和髓系细胞之间细胞通讯的LGALS9-HAVCR2(TIM3)配体-受体对与T细胞死亡有关[44]。总的来说,作者的结果表明 FBLIM1 阳性 CAFs 在肿瘤微环境中具有免疫抑制作用。
作者进一步发现,根据 Gillette 等人的蛋白质基因组学数据,FBLIM1 蛋白的表达水平与 ESTIMATE 基质评分呈正相关。来自 TCPA 的蛋白质阵列数据发现,上皮生物标志物 claudin-7 、 HER3 和 E-cadherin 蛋白的表达降低,而间充质标志物纤连蛋白和 YAP/TAZ 的表达在高 FBLIM1 患者中增加。基于上述免疫亚型模型,作者在 TCGA 数据集的高 FBLIM1 患者中观察到 C1 (伤口愈合) 和 C6 (TGF β 显性) 亚型的比例较高。与低 FBLIM1 患者相比,高 FBLIM1 患者具有更高的 TGF-β 反应和更低的 CD8 T 细胞浸润,导致免疫治疗在 NSCLC 中的疗效不佳。这些结果表明,FBLIM1 阳性 CAFs 具有上皮-间充质转化和免疫抑制表型的特征,这可能是由于 FBLIM1 阳性 CAFs 中 TGFβ 的高表达。最后,为了验证 FBLIM1 对免疫治疗的预后价值,作者收集了 2018 年至 2020 年在肿瘤医院、中国医学科学院和北京协和医学院接受免疫治疗的 21 例 NSCLC 患者的基线肿瘤组织 (CHCAMS 队列)。随访截止日期为 2022 年 9 月 6 日,患者特征总结于表 S2 中。免疫组化测定肿瘤组织中 FBLIM1 蛋白表达水平。Kaplan-Meier 生存分析显示,FBLIM1 蛋白阳性表达的患者免疫治疗结果较差。随后,作者将 18 例随访时间超过 6 个月的患者分别根据他们的进展时间是大于还是小于 6 个月分为反应组和无反应组。结果显示,无反应组 FBLIM1 的表达水平较高。ROC 的 AUC 在 100 天、 200 天和 300 天分别为 0.68、0、85 和 0.9。因此,作者证明 FBLIM1 可能作为临床样本中免疫治疗的不良预后标志物。


总结

总之,作者建立了一种新的基于 CAF 的分类器,可以对高危 NSCLC 和免疫治疗耐药患者进行分层。单细胞转录组分析发现 FBLIM1 阳性 CAFs 是一种侵袭性亚型,通过激活 TGFβ 信号传导诱导 EMT 和免疫逃逸表型。