|
导语
根据GSE243347 包括 27 个样本的单细胞图谱,作者得出了包含 7,182 个细胞和 10,128 个特征的基因表达矩阵,以供进一步分析。使用 Harmony 算法进行批量效应校正和降维,作者通过对单细胞转录组数据的无监督分析()识别出 10 个不同的聚类(聚类 0-10 Figure 1A)。这些簇是根据转录相似性定义的,并使用 t-SNE 投影进行可视化。为了分配生物学身份,作者使用已建立的标记基因对簇进行注释。由此产生的簇被分为七种主要细胞类型:T 细胞、平滑肌细胞、组织干细胞、内皮细胞、单核细胞、软骨细胞和神经元。T 细胞由红色簇 ( Figure 1B)表示。值得注意的是,T 细胞在 ES 患者样本中的分布差异显着,导致鉴定出 489 个 ES 相关 T 细胞标记基因 ( Supplementary Table S1)。这种多样化的细胞景观凸显了组织微环境的复杂性。“CellChat”方法揭示了不同细胞类型之间的实质性连接,特别是在 T 细胞、巨噬细胞和内皮细胞之间,表现出高相互作用强度和大量相互作用。相互作用的数量,表示细胞类型之间存在多少个不同的配体-受体对。在这种情况下,T 细胞表现出显着的相互作用,但比神经元和软骨细胞等高度连接的细胞类型相对较少,后者在相互作用计数方面形成了最广泛的通信网络 ( Figure 1C)。相反,相互作用的权重定义为平均相互作用强度,它反映了细胞类型之间的平均信号强度。在这里,T 细胞表现出很强的信号活性,特别是平滑肌细胞和单核细胞,尽管总相互作用较少。这表明 T 细胞可能参与功能上有效的选择性信号传导,表明肿瘤微环境中具有靶向调节作用 ( Figure 1D)。此外,DEG 分析还鉴定了细胞群特异性的几个基因( Figure 1E)。
单细胞转录组学分析揭示了细胞异质性和细胞间相互作用(A,B)t-SNE 图,识别出各种显示不同的细胞簇。(C) 细胞类型之间配体-受体相互作用的数量。T 细胞表现出适度的连通性,与神经元、软骨细胞和组织干细胞相互作用最多。(D) 细胞类型之间的平均相互作用强度。尽管相互作用较少,但 T 细胞与平滑肌细胞和单核细胞表现出高信号强度,表明有针对性的功能性串扰。(E) 热图突出显示了细胞群中差异表达的基因,揭示了可能有助于细胞类型特异性功能和相互作用的关键分子特征。
NCBI 数据库中肿瘤和健康肌肉组织之间的比较确定了 3,365 个 DEG (Supplementary Table S2)。WGCNA 分析揭示了 ES 肿瘤中不同的模块-性状关系,如 GEO 合并数据集( )中的基因树状图和模块颜色所示 Figure 2A。其中,MEblue 模块与肿瘤性状呈强正相关(r = 0.84,p < 7e−43),而 Meturquoise 模块则表现出稳健的负相关(r = −0.97,p < 1e−99)( Figure 2B)。这些发现表明,这些模块包含可能参与关键生物学功能和疾病机制的基因。作者合并了 Meblue 和 Meturquoise 模块基因,并通过 WGCNA 获得了 2,609 个基因。( Supplementary Tables S3, S4)。DEG、WGCNA 基因与 T 细胞标记基因的交叉产生了 174 个差异 T 细胞标记基因用于下游分析 ( Figure 2C, Supplementary Table S5)。
鉴定 T 细胞相关基因和富集途径。(A) 来自 GEO 数据集的带有模块颜色的基因树状图。(B) 显示相关性和显着性的模块-特征关系。(C)DEG、T 细胞标记和 WGCNA 鉴定基因的交集,强调免疫和结构基因关联。(D)KEGG 通路分析,突出 PI3K-Akt 信号传导、粘连斑和病毒致癌作用。(E)GO 富集生物过程、细胞成分和分子功能。颜色表示调整后的 p 值(红色 = 较高的显着性,蓝色 = 较低的显着性)。点大小反映了基因比率(每个途径中富集的基因比例)。
通路富集分析(KEGG) 揭示了这些基因参与关键的癌症相关途径,例如与膀胱癌、小细胞肺癌和病毒致癌有关的途径,凸显了它们在肿瘤发生和免疫逃逸中的潜在作用。信号转导途径,包括 PI3K-Akt 和 FoxO 信号传导,是细胞存活、增殖和细胞凋亡的成熟介质,并且在癌症中经常失调 (Supplementary Table S6)。此外,与传染病相关的途径,如人类巨细胞病毒感染和耶尔森氏菌感染,表明这些基因在感染反应和炎症中具有双重作用。生物过程的 GO 分析揭示了对这些细胞功能作用的重要见解。在 BP 类别中,细胞投射组织的正调控、化学突触传递的调节和神经元投射组织等关键过程得到丰富,表明其在神经连接和信号通路中的作用。CC 分析强调了关键的结构成分,包括细胞-基质连接、粘附灶和含胶原蛋白的细胞外基质,强调了它们在维持细胞结构和介导细胞-细胞外基质相互作用方面的重要性。在 MF 类别中,肌动蛋白结合、胰岛素受体结合和蛋白质半胱氨酸活性等丰富功能表明参与细胞骨架重塑、信号传导和代谢调节 ( Figure 2E, Supplementary Table S7)。WGCNA(MEblue 和 MEturquoise)模块中的 DEG 与 T 细胞标志物显着相关,表明它们可能参与调节免疫细胞功能,例如抗原识别和效应反应。 这些结果共同揭示了遗传调控、免疫功能和疾病过程之间的相互作用,为对这些基因簇的生物学意义提供了全面的理解。
使用 T 细胞标记基因的 DEG,作者进行了分子亚型分析,将 ES 患者最佳地聚类为两个具有高内部连贯性的亚组 ( Figures 3A, B)。生存分析表明,与 C1 组患者相比,C2 组患者的预后明显更好 (p < 0.038) ( Figure 3C)。热图根据不同的簇 C1 和 C2 的临床特征和表达谱来区分它们。C1 群包括更多患者,主要与转移性疾病、疾病进展和不良生存结果相关,表明其与侵袭性疾病表型存在潜在联系。相比之下,C2 群患者具有非转移性和缓解状态,表明疾病特征不太严重 ( Figure 3D)。该分析强调了簇 C1 和 C2 之间不同的肿瘤生物学和免疫微环境。此外,C2 簇表现出显着更高的肿瘤纯度,表明肿瘤细胞群更密集( Figure 4A)。相比之下,与 C2 相比,集群 C1 显示出显着更高的免疫评分、基质评分和 ESTIMATE 评分 ( Figures 4B–D)。尽管免疫存在升高,但 C1 簇似乎并未产生有效的抗肿瘤免疫反应。免疫细胞分析显示,C1 主要由免疫抑制细胞群浸润,例如 M2 巨噬细胞和单核细胞,已知它们可以抑制细胞毒性免疫活性并支持肿瘤进展。相反,C2 簇显示出更高比例的γδ T 细胞,CD4 + 幼稚 T 细胞和活化肥大细胞,这些细胞类型与先天免疫激活,抗肿瘤启动和免疫监视相关 Figure 4E()。同样,在分子水平上,C1 簇表现出免疫抑制检查点分子的表达增加,包括 LAG3 和 HAVCR2(TIM-3),这两种分子都是 T 细胞耗竭和功能障碍的典型标志物。尽管 C1 中 CD8A 表达也显着升高,表明存在细胞毒性 T 细胞,但这可能被抑制性受体的高表达和抑制性免疫亚群的存在所抵消,从而导致功能受损的免疫反应。相比之下,尽管免疫和基质浸润较低,但簇 C2 的 IFNG、PDCD1 (PD-1) 和 JAK1 表达显着升高 ( Figure 4F)。这些标志物表明干扰素信号传导活跃、T 细胞受体激活和免疫共刺激,表明 C2 中存在的免疫细胞保留了其功能和反应性。尽管 C2 中的 CD8A 水平较低,但表达谱支持更具免疫允许性和反应性的微环境。
患者亚组的共识聚类和生存分析。(A) 累积分布函数(CDF)和验证聚类稳定性的共识指数图。(B) 两个聚类之间 k=2 的共识矩阵显示出清晰的分布。(C) 比较聚类 C1 和 C2 的 Kaplan-Meier 生存分析。(D) 跨集群的临床特征分布,包括性别、生存状态、疾病状态和转移阶段。
集群之间的肿瘤微环境(TME) 和免疫景观差异。(A)C1 和 C2 之间的肿瘤纯度差异显着。(B-D)ESTIMATE 分析显示,一个集群中的免疫和基质评分更高。(E) 免疫细胞浸润分析揭示了集群之间不同的 TME 谱。(F) 免疫相关基因表达各不相同,特别是在检查点分子和调节因子中。* 符号表示,单个 * 表示 p 值小于 0.05,表示存在统计学上的显着差异。两个 ** 表示小于 0.01 的 p 值,表明存在非常显着的差异,而三个 *** 表示 p 值小于 0.001,反映了非常显着的差异。
这些差异的基因表达模式表明,C1 簇代表了一种免疫浸润但免疫抑制的表型,免疫功能障碍可能是由慢性抗原刺激和抑制信号传导升高驱动的。相比之下,C2 簇反映了一种免疫功能表型,其特征是更有效的免疫成分,可能有利于更好地控制肿瘤生长。
为了提高候选基因的特异性,作者进行了 K-M 图和单变量 Cox 分析,使用 ICGC 数据集鉴定了 1,746 个预后相关基因,这些基因与队列中的患者结局显著相关( Figure 5A, Supplementary Table S8)。此外,通过将这些预后相关基因集与 174 个基因集相交,作者确定了 7 个对后续分析至关重要的关键预后相关基因。然后,作者进行了多因素 Cox 回归分析来构建模型,选择了三个关键基因:CLEC11A、BDP1 和 ID3。计算了这些基因的风险比,并在生存分析中确定它们具有显着性。CLEC11A 和 BDP1 被证明是保护因素,风险比分别为 0.70(95%CI:0.52–0.93,p = 0.013)和 0.77(95%CI:0.63–0.93,p = 0.006),表明这些基因的较高表达与更好的生存结局相关。相比之下,ID3 被确定为风险因素,风险比为 1.36(95% CI:1.06–1.74,p = 0.016),表明其较高的表达与较差的生存率相关 ( Figure 5B)。根据患者的基因表达谱将患者分为高危组和低危组。3 个基因的基因表达热图显示出高危和低危患者之间的表达模式不同。患者的风险评分分布和生存状况表明,高危组患者的生存结局较差,如风险评分较高和死亡率增加所示 Figures 5C, D()。K-M 生存曲线显示了两个风险组的显着性 (p = 5.32e-04) ( Figure 5E)。生成时间依赖性 ROC 曲线来评估模型的预测性能,AUC 值为 1 年 0.85,3 年 0.82,5 年 0.78,预测准确率高 Figure 5F()。最后,使用生物标志物 ID3、CLEC11A 和 BDP1 表达水平通过列线图预测 1 年、3 年和 5 年的总生存概率,从而对总分有所贡献。这表明,得分高的患者在 1、3 和 5 年的生存概率显着更高 ( Figure 6A)。使用校准曲线评估列线图的性能,预测的 OS 与生存率显示出很强的相关性。这些结果证实了列线图在预测生存结果方面的可靠性和准确性 ( Figure 6B)。
用于预后分析和风险分层的基于基因的特征。(A)Vin 图表示普通基因和存活基因之间的基因。(B) 显示 ID3、BDP1 和 CLEC11A 风险比 (HR) 的森林样地 (p < 0.05)。(B). (C) 预后基因热图(D) 风险评分分布与生存状态相关。(E) Kaplan-Meier 曲线显示两个风险组的生存率 (F) ROC 曲线在 1、3 和 5 年显示出很强的预测准确性(AUC:0.77、0.83、0.76)。符号表示,单个 * 表示 p 值 < 0.05 具有统计显着性,而两个 ** 表示 p 值 < 0.01 高度显着。
用于生存预测的列线图和风险分层。(A) 使用 ID3、CLEC11A 和 BDP1 预测总生存期 (OS) 的列线图。(B) 校准图显示预测 OS 与观察 OS 在 1、3、5 年时的一致性。(C) 预后特征基因的热图 (D) 风险评分分布与生存状态相关。(E) Kaplan-Meier 曲线显示高危患者的生存率较差。(F) ROC 曲线显示出预测准确性(AUC:1、3、5 年时为 0.67、0.72、0.71)。(G) 1、3 和 5 年时预测和观察的 OS 之间的一致性校 GSE63157 准图。符号表示,单个 * 表示 p 值 < 0.05 具有统计显着性,而两个 ** 表示 p 值 < 0.01 高度显着。
为了进一步验证模型的预后性能,作者通过两个外部数据集 GSE63157 和 GSE17674 进行了验证。随后,根据 DEG T 评分将患者分为高风险组和低风险组 ( Figures 6C, D)。K-M 分析显示,与低风险组相比,高危患者的生存率较低 ( Figure 6E),并且该模型在使用 GSE63157 数据集的外部验证中也表现出显着较高的 AUC 值 ( Figure 6F)。此外,校准图还显示在 1、3 和 5 年时与 OS 非常吻合 ( Figure 6G)。与一致性类似,作者的模型显示了的其他 GSE17674 数据集中的准确性。可以观察到高风险和低风险的患者。高危患者生存率较低,确认 AUC 值分别为 1 年、3 年和 5 年,预测准确率高。虽然校准图在 1、3 和 5 年时与 OS 非常吻合,但进一步验证了模型的可靠性 ( Supplementary Figure S1)。这些发现的生物学相关性强调了这些基因作为对患者进行分层和根据遗传风险定制治疗方法的生物标志物的潜力。
为了进一步研究 TME 内免疫细胞群的风险与浸润之间的关系,采用 CIBERSORT 算法比较高危组和低危组免疫细胞的比例。结果显示,低风险组对各种免疫细胞群的浸润程度较高,如 B 细胞、CD8+ T 细胞、NK 细胞和树突状细胞表现出更高的免疫反应盛行率Figure 7A()。然后,作者研究了风险评分与免疫检查点基因表达水平之间的潜在关联。结果表明,关键免疫基因水平升高,包括 ADORA2A、CD27 和 HHLA2,这些基因在免疫活性(如 T 细胞激活和存活)中起关键作用 ( Figure 7B)。此外,TMB 的生存分析星场显示,高 TMB 与高危组的生存率在所有协同作用中最低 ( Figure 7C)。此外,低风险肿瘤中的特异性免疫功能及其评分,如抗原呈递细胞(APC) 共抑制、APC 共刺激、细胞溶解活性和 T 细胞共刺激显着更高 ( Figure 7D)。这进一步证实了免疫功能在低风险肿瘤中更加活跃。高危肿瘤的免疫细胞评分和基因表达水平较低,可能会逃避免疫检测和反应,导致临床结果较差。了解这些差异对于开发有效的免疫疗法和改善癌症预后至关重要。此外,确定用于预测 ES 患者化疗反应性的 T 细胞相关基因。 作者根据估计的 IC50 值评估了作者的风险模型与流行化疗药物敏感性之间的关联,结果显示低风险和高风险患者组之间存在显着差异。具体来说,在分析的大多数化疗药物中,高危组的 IC50 值升高,表明预测的药物敏感性较低。相比之下,低风险组始终表现出较低的 IC50 值,表明对化疗的预测反应性较高。这些发现表明,低风险组患者可能更有可能从标准化疗方案中获益,而高风险组患者可能需要替代或联合治疗策略才能达到可比的治疗结果 ( Supplementary Figure S2)。
TMB 和风险人群的免疫景观和生存分析。(A) 免疫细胞浸润评分(例如 B 细胞、CD8+ T 细胞)在风险组之间存在显着差异(***p < 0.001、**p < 0.01、*p < 0.05)。(B) 不同风险组免疫相关基因(例如 ADORA2A、CD27)的差异表达。(C) Kaplan-Meier 曲线显示高 TMB + 低风险与更好的生存率相关 (p < 0.001)。(D) 免疫途径活性(例如,细胞溶解活性、干扰素反应)因风险组而异。
使用 qRT-PCR 技术检测 BDP1、CLEC11A 和 ID3 基因在癌细胞中的表达谱(Supplementary Table S9)。实验数据显示,与 hBMSC(对照)相比,BDP1、CLEC11A 和 ID3 在 A673 和 RD-ES 细胞系中的表达显著上调( Figure 8A)。
ID3 表达和沉默对 A673 细胞的影响。(A)A673 和 RD-ES 细胞中 BDP1、CLEC11A 和 ID3 的 mRNA 水平高于 hBMSC 细胞。(B)ID3 siRNA 转染降低了 A673 细胞中 ID3 的表达,选择最有效的 siRNA 进行进一步实验。(C)ID3 抑制改变了多个肿瘤发生相关基因的表达,包括 p21 和 p27。(D) 增殖分析显示 ID3 沉默可减少 A673 细胞生长。(E、F) 流式细胞术显示,在 ID3 敲低后,G2 期 A673 细胞的百分比增加。单个*表示 p 值< 0.05 具有统计显著性,两个**表示 p < 0.01 高度显著性,三个***表示 p < 0.001 非常显著,四个****表示 p < 0.0001 极显著性。
为了进一步阐明 ID3 基因在 ES 中的生物学功能,采用 RNA 干扰技术,使用三种特定的小干扰 RNA (siRNA) 沉默 A673 细胞中的 ID3 基因 (Supplementary Table S10)。qRT-PCR 结果表明,其中一种 siRNA 对 ID3 表现出最高的敲低效率,因此被选中用于后续实验 ( Figure 8B)。基因表达分析表明,抑制 ID3 导致细胞周期蛋白依赖性激酶 (CKD) 抑制剂 p21 的表达水平显着升高,提示 ID3 的下调可诱导 A673 细胞中 p21 的上调 ( Figure 8C)。同时,敲低 ID3 也改变了其下游靶基因的表达水平,SIX1 的 mRNA 水平显着降低 ( Figure 8C)。这一发现与先前的研究( 21 )相符,该研究证实了 SIX1 在抑制细胞迁移、侵袭和体内转移方面起着至关重要的作用,其蛋白质表达受 EWS/FLI1 的调控。为了评估 ID3 敲低对 ES 细胞增殖的影响,该研究采用了 24 小时间隔细胞计数方法进行监测。结果显示,与对照组相比,ID3 敲低显著抑制了 A673 细胞的增殖能力( Figure 8D)。流式细胞术分析显示,敲低 ID3 诱导 A673 细胞中的 G2 期细胞周期停滞 ( Figures 8E, F)。这些实验结果共同证实,ID3 的基因沉默不仅抑制了 A673 细胞的增殖活性,还显著改变了其细胞周期进程。
总结
综上所述,作者的研究强调,T 细胞调节和稳健预后模型的开发对于改善 ES 患者的预后至关重要。作者的模型集成了免疫和分子标记,为预测患者生存提供了可靠的工具。尤其是 ID3,在免疫逃逸和肿瘤进展中起着至关重要的作用。其过表达影响 P21、TCF3 和 THRA 等关键基因,凸显 ID3 作为未来免疫疗法的有前途的靶点,为更有效的 ES 治疗策略提供了潜力。
|