|
通过 scRNA 测序鉴定 ESCC 中的 prolif Tex 细胞
为探索 ESCCTME 中的细胞异质性,作者处理并整合了 GSE160269 队列的 scRNA-seq 数据,共获得 208,125 个细胞。基于每个簇中的 DEGs,作者注释了细胞类型并鉴定了免疫细胞(CD45+),包括增殖型 T 细胞、T 细胞、NK 细胞、B 细胞和骨髓系细胞,以及非免疫细胞(CD45-),如上皮细胞、内皮细胞、成纤维细胞和周围细胞(图 2A)。增殖型 T 细胞通过表达典型的 T 细胞标志物(CD3D、CD3E、CD3G)和细胞周期相关基因(MKI67、TYMS 和 RRM2)来表征(见图 2B,C)。肿瘤样本中的增殖 T 细胞相较于正常组织富集(图 2D)。为更好地区分肿瘤细胞与正常上皮细胞,作者利用 inferCNV 分析拷贝数变异(CNV),将具有显著 CNV 的细胞归类为肿瘤细胞(见图)。第一季A)
ESCC 队列单细胞图谱(GSE160269)。(A) UMAP 可视化 208,125 个细胞(64 个 ESCC 样本:60 个肿瘤和 4 个正常细胞),按细胞类型着色。(B)定义在(A)中定义的细胞类型标记基因表达的点图。点大小对应表达标记基因的细胞百分比,点颜色表示平均表达。(C)特征图,展示 T 细胞选定标记基因的分布。(D)肿瘤和正常组织中识别出的细胞类型分数箱形图,数值以 SD 平均±表示。(E)按细胞类型着色的 T 细胞 UMAP 可视化。(F) T 细胞周期阶段(G1、S 和 G2/M)的分布。(G)点图展示了不同 T 细胞簇中表达特定 T 细胞功能相关基因的表达水平和百分比。(H)核密度估计图,显示 T 细胞 MKI67 和 CDK4 基因表达的分布。(I) TCGA-ESCC 数据集中肿瘤与正常样本之间 T 细胞亚型的浸润评分。(J)通过 TCGA-ESCC 数据集中 T 细胞浸润分数对 ESCC 患者进行分层的生存分析。
为了全面表征 ESCC 中的 T 细胞亚型,作者重点关注 T 细胞和增殖型 T 细胞,识别出多个 CD4+T 细胞簇(包括 CD4 T Naive、Tfh1、Tfh2、TmemCD4 和 Treg)和 CD8+T 细胞簇(包括 MAIT、TmemCD8、NKT、Teff 和 Tex)。Treg 是抑制炎症免疫反应的有效剂,在所有组织中都是预防破坏性免疫的关键物质 49。NKT 细胞是最近发现的 T 细胞,表达 NK 细胞表面标记和 T 细胞表面受体 50。增殖型 T 细胞进一步分为增殖型 Treg、prolif 型 Tex 细胞和增殖型 NKT 细胞(见图)。阿拉伯数字E)。细胞周期分析显示,增殖型 T 细胞主要进入 G2/M 和 S 期,表明其为活跃增殖(见图)。阿拉伯数字为研究 T 细胞间的表达变异,作者探索了与不同细胞状态相关的若干标记基因的表达,包括先天状态、效应基因、耗竭基因和增殖基因(图)。阿拉伯数字G)。prolif Tex 和 prolif Treg 细胞均表现出高增殖标志物(MKI67、UBE2C、TOP2A)表达,prolif Tex 细胞表达较高水平的疲劳标记物(LAG3、PDCD1、CTLA4),而 prolif Treg 表现出高表达的 CD4 细胞标志物(FOXP3、CD4、IL2RA)。此外,Prolif Tex 细胞根据显性表达 CDK4 或 MKI67 分为两个主要亚型(见图)。阿拉伯数字H). 基于 prolif Tex 细胞的这些独特表达模式,作者进一步分析了该子集与 TCGA-ESCC 整体 RNA-测序数据临床预后的相关性。
Prolif Tex 细胞代表性基因集的高表达与较佳预后相关
为探讨 Prolif Tex 细胞在 ESCC 中的功能作用,作者进行了免疫浸润分析和存活分析。作者选择了 GSE160269 单细胞数据集中上调的前 50 个 DEG 作为这些亚型的代表基因集。随后,ssGSEA 被用于计算 TCGA-ESCC 队列中 T 细胞的浸润得分。正常组织与肿瘤组织浸润评分的比较显示,Treg、prolif Treg、Tex 和 Prolif Tex 细胞在肿瘤组织中的浸润评分显著高于正常组织,表明 Prolif Tex 细胞在 ESCC 中的富集(图 2I)。Prolif Tex 细胞的浸润随肿瘤进展呈上升趋势,尽管不同肿瘤分期的差异在统计学上无显著性(见图。第一季B)为进一步评估 Prolif Tex 细胞对生存结果的预后影响,患者根据 Prolif Tex 细胞浸润水平分为高风险组和低风险组。分析显示,大多数 T 细胞亚型的高浸润水平与不良患者预后有关。然而,Prolif Tex 细胞高浸润水平与 ESCC 患者生存率提升显著相关(图 2J)。这些发现表明 Prolif Tex 细胞可能在 ESCC 内的抗肿瘤免疫反应中发挥支持作用。
功能富集分析显示 Prolif Tex 细胞具有高耗竭性和增殖特性
为了进一步研究 Prolif Tex 细胞的表达特性,作者使用 MSigDB 的细胞周期基因集进行了 GSEA 分析。分析显示,prolif 的 Tex 细胞中细胞周期相关基因的显著富集,而 Tex 和 Teff 细胞中未见此现象(见图)。3 对 Prolif 的 Tex 细胞、Tex 和 Teff 细胞的 DEG 进行了 GO 和 KEGG 富集分析(见图)。3B)。这些分析表明,prolif Tex 细胞在与细胞周期、DNA 复制和微管相关结合相关的通路中显著富集,表明其在肿瘤相关增殖中占主导地位。此外,利用 Cheng 等人提供的基因集计算了增殖、耗竭和细胞毒性评分。36。结果显示,Prolif Tex 细胞的增殖分数显著高于非增殖型 T 细胞(见图)。3 此外,prolif tex 细胞和 Tex 细胞的耗尽和细胞毒性评分显著高于 Teff 细胞,表明 Prolif Tex 细胞具有较高的增殖能力和潜在的细胞毒性功能。
Prolif T 细胞的特征。(A) Teff、Tex 和 prolif Tex 细胞周期相关基因集的 GSEA。(B)Teff、Tex 和 Prolif Tex 细胞中 DEGs 的 GO 和 KEGG 途径富集分析。KEGG 数据库的使用是在金久实验室(Kanehisa Laboratories)许可下进行的。(C) Violin 图比较 Teff、Tex 和 prolif Tex 细胞的增殖评分、耗竭评分和细胞毒性评分,数值以平均±标准差表示。(D) T 细胞受体克隆群体的 UMAP 可视化。(E)使用 Morisita 交集指数显示 T 细胞亚型 TCR 交集指标的热图。(F) CytoTRACE 分析及 T 细胞分化程度的可视化,分数越高表示干性越高。(G)CD8 + T 细胞的分化轨迹,按细胞亚型(左)和伪时间(右)着色。每个点都表示一个单元格。
Prolif Tex 和 Tex 在高肿瘤期样本中表现出扩展性的克隆增殖
T 细胞受体 VDJ 测序数据使得基于同源 TCR 的 T 细胞克隆扩增分析成为可能。配对的 TCR 测序和 scRNA-seq 分析显示,CD8+T 细胞(Teff 细胞、Tex 细胞、Prolif Tex 细胞和 T memCD8)表现出高度扩展的 TCR 克隆,其中 Tex 和 Prolif Tex 细胞主要由大型和中型克隆组成(见图。阿拉伯数字E 和 3D)。作者分析了不同阶段肿瘤样本中 T 细胞亚型的克隆组成(见图。第一季C)大型 TCR 克隆在正常组织中几乎不存在。然而,与第一期肿瘤样本相比,Tex 和 Prolif Tex 的大型克隆在 II/III 期肿瘤样本中显著丰富,而 Teff 细胞则无显著差异。这些结果表明,Prolif Tex 和 Tex 细胞的克隆大小随着肿瘤阶段的进展而增加。
交集的 TCR 克隆为 T 细胞分化轨迹的关联提供了洞见 53。TCR 序列的比较显示 Teff 细胞、Tex、prolif Tex 细胞和 T memCD8 细胞之间存在高度交集。值得注意的是,Tex 与 prolif Tex 细胞之间的 TCR 相似度高达 0.79,表明两亚型之间存在密切的谱系关系(见图。3E)。这些发现凸显了 Tex 细胞与 Prolif Tex 细胞之间显著的克隆扩增和高度的 TCR 相似性,强调了它们在 ESCC 进展中的关键作用。
为研究 Prolif Tex 细胞的分化潜力,计算了 CytoTRACE2 分化分数,显示 prolif Tex 细胞表现出较低的分化可塑性,表明细胞命运更为明确(见图)。3 为进一步探讨 Prolif Tex 细胞的分化轨迹,基于 CD8 + T 细胞的转录相似性进行了伪时间分析,重点关注 Teff 细胞、Tex 和 prolif Tex 细胞。伪时间轨迹始于 Teff 细胞簇,展现出逐渐分化过程,从 Teff 细胞过渡到 Tex 细胞,最终到达 Prolif Tex 细胞(见图 3G)。综合来看,prolif Tex 细胞表现出更高的分化势,与 Tex 细胞共享部分 TCR 相似性,并且处于从 Teff 细胞出发并向 Tex 细胞推进的分化轨迹的末端分化状态。
作者的目标是对 ESCC 中的 Tex 亚型进行表征,并进行了重聚分析(见图)。第二季A)。祖体 Tex 亚组表现出高表达的类干标记 IL7R,符合其前体样特征,而 Prolif Tex 细胞则表现出增殖和细胞周期相关基因的表达升高(见图)。第二季B)。TCR 分析显示,Prolif Tex 细胞与 CXCL13 + Tex 细胞在克隆上相似度最高,而其与前体 Tex 的交集相对较低(Morisita 指数=0.221)(见图。第二季在伪时间分析中,Prolif Tex 细胞位于 Tex 分化轴的末端,与前体 Tex 不同(见图)。第二季D 和 E)。这些发现表明,prolif Tex 和祖体 Tex 代表了两个在转录和发育上都截然不同的亚集,分子特征各异。
为进一步验证 Prolif Tex 细胞的功能特性,对GSE145370 ESCC 单细胞数据集进行了独立验证。采用与 GSE160269 相同的方法,数据被处理以识别细胞簇(见图)。第三季A),随后是 T 细胞注释(图。第三季B)。与 GSE160269 研究结果一致,发现了 prolif Tex 细胞,共表达增殖和疲劳标记(见图)。第三季C)。基于 MKI67 和 CDK4 表达,Prolif Tex 细胞被分为两大亚型(见图。第三季D),主要位于 G2/M 和 S 阶段,表现出更高的分化潜力评分(见图。第三季E 和 F)。此外,Prolif Tex 细胞主要位于 CD8 + 细胞伪时间轨迹的末端阶段(见图)。第三季总体而言,这些研究表明 Prolif Tex 细胞位于 CD8 + T 细胞发育轨迹的末端位置,并表现出独特的分化潜力。这一结论得到了作者发现组和验证组一致支持。
产细胞化后分化潜力降低,Prolif Tex 细胞比例下降
为了研究 NAT 对 TME 中 prolif Tex 细胞分化潜力和丰度的影响,作者分析了 OMIX005710 数据集,这是一个包含 NAT 前后采集样本的 ESCC 单细胞数据集。使用相同的数据处理方法,作者从 OMIX005710 获得了 166,200 个细胞。细胞类型注释基于每个细胞簇中表达差异的基因进行(图)。4A),每种细胞类型都表现出其特征标记基因的高表达(图 4B)。随后,提取、重新聚集并重新注释 T 细胞,最终鉴定出 Prolif Tex 细胞(图 4C)。这些细胞表现出高表达的增殖和耗竭相关基因(图 4D),并根据 CDK4 和 MKI67 表达模式进一步分为两个簇(图 4E)。细胞周期分析显示,prolif Tex 细胞主要占据 G2/M 阶段(见图 4F)。分化电位分析显示,胚胎 Tex 细胞在 NAT 处理后分化潜力显著降低(图 4G,S4A–C)。此外,NAT 处理后 prolif Tex 细胞比例下降,而 Naive 样细胞和 Teff 细胞则增加(图 4H 和 S4C)。伪时间分析进一步显示,Prolif Tex 细胞主要出现在 CD8 + T 细胞分化轨迹的末端分支,从传统 Tex 细胞分支出来(图 4 I)。 值得注意的是,分化途径在处理前后有所不同:Teff 细胞在处理后沿主分化轨迹形成两条分支,其中一条并非起源于类 Naive 细胞,而预处理样本仅显示一条分支。 这些观察表明 Prolif Tex 细胞可能分化为替代功能状态,或表现出对治疗的敏感性增强,导致他们极度疲惫。
ESCC 新辅助化疗-免疫治疗队列(OMIX005710)单细胞图谱。(A) UMAP 对 6,679 个细胞(46 个 ESCC 样本:22 个处理前和 24 个处理后样本)进行可视化,按细胞类型着色。(B)定义在(A)中定义的细胞类型标记基因表达的点图。点大小对应表达标记基因的细胞百分比,点颜色表示平均表达。(C)按细胞类型着色的 T 细胞 UMAP 可视化。(D)显示 T 细胞中典型标记基因的平均表达。(E)核密度估计图,显示 MKI67 和 CDK4 基因在 T 细胞中的表达分布。(F)T 细胞周期相位的分布。(G)增殖性 Tex 细胞在纳特治疗前后分化潜能评分。(H)冲积图(左)和箱形图(右),比较样本中 NA 前后 Prolif Tex 细胞比例。(I)按伪时间组和样本组(新辅助化疗-免疫治疗前后)分化轨迹,按细胞亚型(左上)、伪时间(右上)和处理组(下)着色。每个点都表示一个单元格。
为研究 Prolif Tex 细胞在纳特拉皮治疗中的预后影响,作者比较了三组治疗反应组间的比例。尽管反应较好的患者 Prolif Tex 细胞比例较高,但这一差异在统计学上并不显著(见图 S4D)。基于 OMIX005710 和 GSE145370 数据集中不同细胞类型浸润水平的 TCGA-ESCC 队列生存分析显示,prolif Tex 细胞的高浸润与生存结果显著相关(见图 S4E),与 GSE160269 队列的发现一致。总体而言,NAT 治疗显著降低了 Prolif Tex 细胞的分化潜力和比例,这可能是由于其分化为替代功能状态或对免疫治疗的敏感性增加。
利用先前分析的三个单细胞数据集,作者识别了 prolif tex 细胞间的共享 DEGs(补充材料 2:表 S2)。通过单变量 Cox 回归分析,选出了 42 个与预后显著相关的基因(图 5A)。利用这些预后 DEGs,机器学习技术构建了一个全面的预测模型。最终,选择了使用 Enet(α = 0.4)的预后模型(见图 5B 和 C)。该模型包含十九个基因,其中包括 12 个风险基因和 7 个保护基因(图 5D)。计算了每个样本的风险评分,并将患者分为高风险组和低风险组。Kaplan-Meier 生存分析显示,高风险组患者的预后显著低于低风险组(图 5E)。TCGA 和 GEO 队列中患者存活状态及风险评分分布见图 S5A。为进一步验证模型,作者分析了单细胞数据集 GSE160269 中 19 个基因的表达分布。结果显示,这些基因中的大多数在 Prolif 的 Tex 细胞中表达较高(见图 5F)。此外,基于 prolif Tex 细胞 DEGs 的 ssGSEA 应用于评估 TCGA-ESCC 队列中 prolif Tex 细胞的浸润情况。研究结果显示,低风险组患者 Prolif Tex 细胞浸润水平较高(见图 5G),与作者之前的发现一致,即 Prolif Tex 细胞高浸润率与 ESCC 患者生存率提升相关。
预后风险模型的构建与评估。(A)通过单变量 Cox 回归分析获得的 42 个预后相关基因的火山图(P < 0.05),并用保留在最终模型中的基因标记。(B)λ选择变量轨迹(最优λ = 0.061)。(C)自变量在最优λ的分布。(D)风险签名中 19 个基因的 Enet 回归系数。(E)基于预后模型对 TCGA-ESCC、GSE53622、GSE53624 和 GSE53625 队列(TCGA-ESCC:n = 86,GSE53622:n = 60,GSE53624:n = 119,GSE53625:n = 179)的整体生存分析。 (F) scRNA-seq 数据集中 19 个预后基因在不同细胞类型的表达 GSE160269。(G)基于 SSGSEA 的高风险和低风险组浸润评分。(H,I )单变量(左,风险评分 HR = 6.536,P = 1.15 × 10−8)和多变量(右,风险评分 HR = 7.263,P = 1.45 × 10−8)基于风险评分和临床病理特征进行 Cox 回归分析。 (J)整合性别、T 期、N 期、临床期及风险评分的诺姆图,用于预测手术。(K) 1 年和 2 年 OS 预测的校准曲线。
为识别独立的预后因素并开发预测性线表图,作者将临床病理特征与风险评分整合。单变量和多元 Cox 回归分析均证实风险评分为独立预后因素(P < 0.001)(图 5H 和 I)。利用多变量 Cox 回归,构建了预测性计量图,将风险评分及性别、T 阶段和 N 阶段纳入其中(图 5J)。校准图结果显示,该计录图对实际生存结果具有较强的预测准确性(见图 5K)。
为了进一步阐明本模型预后意义背后的免疫机制,作者通过比较 TCGA-ESCC 队列中高风险组和低风险组的免疫和基质细胞组成,分析了免疫浸润特征。CIBERSORT 显示,高风险患者 CD8+T 细胞、M1 和 M2 巨噬细胞及 Treg 细胞比例增加,而低风险组则显示静息 NK 细胞和静息记忆 CD4+T 细胞比例增加(见图)。6 进一步分析肿瘤微环境中的免疫和间质细胞浸润,发现高风险组的 ESTIMATE 评分、免疫评分和基质评分显著升高于低风险组(图 6B)。尽管低风险组肿瘤纯度更高,但免疫和基质浸润水平下降,表明低风险组 TME 具有明显的免疫抑制特征。此外,CORO1A 和 TNFSF10 与免疫评分呈正相关,而 ESCO2 和 DBF4 呈负相关(见图 S5B)。
免疫浸润分析。(A)高风险和低风险组 28 种免疫细胞类型的分布(TCGA-ESCC)。(B)风险组间的 ESTIMATE、stromal 和免疫评分(TCGA-ESCC)。(C)通过 T 细胞 SI 算法(TCGA-ESCC)计算的 T 细胞状态评分。 (D)ESCCTME 中免疫细胞浸润热图。(E-F)预后模型特征与免疫相关细胞比例、免疫、单程和估计分数的相关性。
利用 TcellSI R 套件,作者分析了 T 细胞相关免疫状态,发现除静息状态外,高风险组的 T 细胞功能活性显著高于低风险组(见图)。6C. 高风险组患者表现出显著更高的免疫和基质细胞浸润水平(图 6D)。此外,保护基因如 NUDT11 和 DBF4 与基质评分、免疫评分和 ESTIMATE 评分呈反相关(见图 6F)。包括 CORO1A、PSMB8 和 TNFSF10 的风险基因与大多数免疫细胞浸润率显著相关,而保护基因如 DBF4、ESCO2 和 RBBPB 则与浸润水平降低相关(见图 6E 和 S5C)。综合来看,高风险组患者表现出增强的免疫浸润和免疫活动,表现为免疫评分升高,这与低风险组肿瘤中观察到的免疫抑制性肿瘤微环境形成对比。这些发现表明,TCGA-ESCC 低风险患者可能更有可能从免疫治疗中受益,从而可能延长生存时间。
为评估预后模型预测免疫治疗反应的能力,作者分析了两个独立数据集,分别是 GSE78220 和 IMvigor210。IMvigor210 队列包含 348 名接受抗 PD-L1 抗体治疗的黑色素瘤患者,根据治疗结局分为完全缓解组(CR)、部分反应组(PR)、稳定病组(SD)和进展性疾病组(PD)。同样,GSE78220 数据集还包括接受抗 PD-1 免疫检查点抑制治疗的黑色素瘤患者。在这两个数据集中,高风险评分组的患者 OS 表现显著更严重。此外,高风险组的 PD/SD 患者比例显著高于低风险组,而低风险组的 CR/PR 率显著更高。这些发现表明高风险组对免疫检查点抑制反应较差相关(图 7A 和 B)。为验证这些结果,作者进一步分析了另外两个独立数据集,GSE67501 和 GSE165252(图 7C 和 D)。与先前发现一致,两组 CR/PR 患者风险评分显著较低,而 PD/SD 反应者风险评分较高。综合来看,这些结果表明高风险组的免疫治疗结局显著比低风险组更差。
通过多个公开队列的风险特征预测免疫治疗反应。(A)GSE78220 的 Kaplan-Meier 图及治疗反应分布。(B)IMvigor210 中的 Kaplan-Meier 图及治疗反应分布。(C)GSE67501 中按风险组划分的免疫治疗反应率。(D)GSE165252 中按风险组划分的免疫治疗反应率。
考虑到高风险组和低风险组的预后差异,作者通过 CMap 数据库进行作用机制(MoA)分析,旨在识别潜在的治疗药物。无花果。S6A 重点介绍了预测对 ESCC 治疗最有效的前 50 种药物及其相关通路。使用 R 中的 OncoPredict 软件包构建脊回归模型并预测药物敏感性,生成 198 种药物的 IC50 值。高风险组与低风险组 IC50 值比较显示药物疗效显著差异,34 种药物显示统计学显著变异(见图 S6B)。
进一步的 IC50 值与风险评分的相关分析显示,参与细胞周期调控的基因与药物耐药性或敏感性之间存在显著关联(见图 S6C)。风险评分与大多数药物的 IC50 值呈负相关,表明其在高风险组中的疗效更高。此外,基于样本中的平均 IC50 值,作者确定了 IC50 值最低的前 20 种候选药物(见图 S6D),这些药物可能成为 ESCC 有前景的治疗选择。
为进一步验证基于 Prolif Tex 的模型及候选基因,选取了六个风险特征基因,在院内 ESCC 患者中进行实验验证。TNFSF10、ESCO2 和 DBF4 在肿瘤组织中的表达水平显著高于正常组织(图 8A),表明 Prolif Tex 细胞在肿瘤组织中富集。有趣的是,尽管 ESCO2 和 DBF4 在风险模型中被定义为保护基因,但它们在肿瘤组织中的表达水平却升高。此外,某些风险基因如 CORO1A 和 RAB8A 在肿瘤样本中表现出表达增加的趋势,而其他如 NDUFB11 基因在肿瘤组织中的表达水平相对较低(见图 S7A),尽管差异在统计学上并不显著。这些观察表明,这些基因在肿瘤中的功能调控可能涉及更复杂的机制。
在 ESCC 中 prolif Tex 细胞枢纽基因的 qRT-PCR 验证。(A) DBF4、ESCO2 及 TNFSF10 在正常食管组织和 ESCC 组织中的表达。学生 t 检验用于比较正常组织与肿瘤组织间的基因表达。(B)Kaplan-Meier 生存分析,比较 ESCO2 表达水平分层的 ESCC 患者 DFS 与 OS。(C)ESCC 患者临床因素的皮尔逊相关分析。
进行了生存分析以评估基因表达水平与临床结局之间的关联。构建了无病生存(DFS)和无病生存率(OS)的 Kaplan-Meier 生存曲线(见图)。8B)。ESCO2 表达较高组患者的 DFS 显著延长,OS 也观察到类似但不显著的趋势,表明 ESCO2 可能作为早期 ESCC 诊断的潜在生物标志物。其他候选基因的 KM 曲线见图。S7B 和 C。临床变量的相关分析显示,T 期和 N 期与生存时间呈显著负相关,表明晚期患者生存期较短(见图 8C)。总之,实验验证显示肿瘤对保护基因 ESCO2 和 DBF4 的上调,高 ESCO2 表达与生存率改善相关。
总结
本研究中,作者识别出 ESCC 肿瘤微环境中一种新型 Prolif Tex 细胞子集,其特征是耗尽和增殖标志的共表达。Prolif Tex 细胞浸润率更高与患者生存率提升相关。这些细胞起源于传统 Tex,并在肿瘤组织中进行了特别富集。此外,基于 Prolif Tex 细胞的预后模型显示,预测 ESCC 患者的预后具有有效性。作者的发现强调了 Prolif Tex 细胞作为 ESCC 生物标志物和治疗靶点的潜力,为风险分层和免疫治疗反应预测提供了宝贵见解。
|