导语

结果:
本研究工作流程
作者研究的整体工作流程如图所示。
乳腺癌患者机械刺激模式综合分析流程图乳腺癌中 OS 相关 MSRGs 的遗传变异景观
经过单变量 Cox 回归分析,选取了 23 个与 BRCA 相关的 OS 相关 MSRG 进行进一步分析(见图)。阿拉伯数字A)使用 Circos 图展示了 23 种与 OS 相关的 MSRGs 的染色体位置(图 2 B)。在体细胞突变分析中,991 个样本中有 419 个(42.28%)表现出突变。在这些突变中,错义突变最为普遍,PIK3CA 表现出最高的突变率(见图 2C,D)。相关网络图展示了 23 个基因之间的表达相关性(图 2E)。此外,对 OS 相关 MSRG 中 CNV 频率的分析显示,扩增和拷贝数丧失均普遍存在(见图 2F)。
与乳腺癌患者总存活期(OS)相关的机械刺激相关基因(MSRGs)变异景观。通过单变量 Cox 回归分析识别出与 OS 相关的 MSRGs。B 染色体位置的 OS 相关 MSRGs。C-D Oncoplot, 描绘 TCGA 队列中 OS 相关 MSRG 变异的频率。O 相关 MSRG 的 E 相关网络。TCGA 队列中与 OS 相关的 MSRG 的 F 拷贝数变异(CNV)频率
共识分子聚类分析
通过共识聚类,根据 OS 相关 MSRGs 的表达水平确定分子聚类。基于图中结果,K=2 被确定为稳定聚集。3A-B。因此,所有乳腺癌样本被分为两个分子子组:A 群(n = 582)和 B 群(n = 476)。PCA 显示了两个星团之间明显的分离(图 3C)。与 B 群相比,A 群的总体生存期显著延长(P = 0.013,HR = 0.67,95% CI:0.48–0.92;图 3D)。如 ssGSEA 结果所示(图 3E),A 群患者预后较佳,其肿瘤微环境中表现出免疫“热”表型。ESTIMATE 分析显示,A 群患者在估计分数、免疫评分和间质评分均较 B 群患者升高,肿瘤纯度降低(图 3F)。CIBERSORT 算法揭示,A 群患者的 TME 显示,原始 B 细胞、CD8+ T 细胞、CD4+ 记忆 T 细胞和巨噬细胞 M1 显著富集。相反,B 簇患者在 TME 内 M0 和 M2 巨噬细胞显著增加(见图 3G)。
机械刺激相关基因(MSRGs)的无监督聚类。k= 2 的共识矩阵热图。B 共识聚类累积分布函数(CDF)图。C 对两个集群的转录组谱进行主成分分析(PCA)。D 基于两个集群的 TCGA 队列乳腺癌患者的 Kaplan–Meier 曲线。统计学,两阶段分析。E 热力图显示两个集群的 ssGSEA 结果。(F)两个簇在 ESTIMATE 评分、基质评分、免疫评分和肿瘤纯度上的差异。统计学,威尔考克森检验。*p < 0.05;**p < 0.01;p < 0.001。G 箱形图展示了两个簇间 22 种免疫细胞类型浸润水平的差异。统计学,威尔考克森检验。*p < 0.05;**p < 0.01;p < 0.001
机械刺激相关预后特征的构建与验证
在训练集中,识别出 260 个 DEGs(调整后p < 0.05,|log2FC|> 1.5),其中 B 群下调基因 242 个,A 群 18 个上调基因,如火山图所示。随后,作者利用单变量 Cox 回归识别出 50 个与 OS 相关的 DEGs,显著性标准为 p< 0.05,以便进一步分析。通过在乳腺癌病例中应用 LASSO Cox 回归分析,保留了 15 个关键基因以确定预后特征(ALDH3A1、CCL19、CDH19、CEACAM5、CPLX2、CWH43、CXCL1、FABP7、JCHAIN、KIAA0319、KRT15、PIGR、SPIB、TCN1、TEX19),并在火山图中标注(图 4A-B)).根据预后特征,每位患者的机械刺激指数(MSI)计算如下:风险评分=—(ALDH3A1 表达)* 0.158859715—(CCL19 表达)* 0.015415473—(CDH19 表达)* 0.098733091 + (CEACAM5 表达) * 0.01187718 + (CPLX2 表达) * 0.027222987 + (CWH43 表达) * 0.157808964—(CXCL1 表达) * 0.030283461—(FABP7 表达) * 0.003265046—(JCHAIN 表达) * 0.047094207 + (KIAA0319 表达) * 0。056197265—(KRT15 表达)* 0.005340380—(PIGR 表达)* 0.012580670—(SPIB 表达)* 0.028761345—(TCN1 表达)* 0.059128906 + (TEX19 表达)* 0.109843007。作者进一步研究了 TCGA 中的基因表达,发现若干特征基因(TCN1、PIGR、KRT15、JCHAIN、FABP7、CXCL1、CDH19、ALDH3A1)在肿瘤中下调,而其他基因(如 TEX19、SPIB、KIAA0319、CEACAM5)则上调。 这些模式与其回归系数的方向大致一致,凸显了 15 基因特征的稳健性。根据上述公式计算的风险评分,在训练组和验证组中,乳腺癌病例分别分为高风险组和低风险组。风险评分与多种临床特征显著相关,包括存活状态(活或死)、肿瘤分期(T1–T4)及临床分期(I–IV),但淋巴结受累(N0–N3)(见图 4C-F)。乳腺癌患者总体生存期的 Kaplan–Meier 曲线显示,低风险评分个体在两组中均表现出显著更长的总体生存期(TCGA:P < 0.0001,HR = 0.43,95% CI:0.30–0.60;指标:P < 0.0001,HR = 0.66,95% CI:0.59–0.74;图 4 G-H)。此外,在 GSE96058 和 GSE20685 队列中,低风险组也表现出更有利的结果,支持作者预后特征在独立数据集上的普遍适用性(GSE96058:P = 0.0036,HR = 0.73,95% CI:0.59–0.90;GSE20685:P = 0.0030,HR = 0.51,95% CI:0.32–0.80)。为进一步分析预后特征与临床特征的关系,作者在 TCGA 队列中进行了存活分析,按肿瘤分期(T1–T4)、淋巴结受累情况(N0–N3)和临床阶段(I–IV)分层,并以中位风险评分为界。结果显示,低风险组患者在大多数乳腺癌进展阶段(T2、T3、N0、N2 及 II、III、IV)的生存率显著更好。 在其他亚组中,低风险组持续表现出趋向更好结局的趋势,尽管差异未达到统计显著性,可能是由于样本量有限。作者使用桑基图比较了两个患者群的风险评分,发现高风险组占 B 群患者超过一半,A 群仅少数。与此同时,对风险评分与患者存活事件分组的分析显示,高风险评分组中发生致命结局的患者比例更高。图 4J 展示了 TCGA 队列中风险评分、总体生存状态与临床病理特征之间的关系。
构建乳腺癌患者的预后基因特征。A-B 套索回归分析 OS 相关 DEGs。C-F Violin 图显示风险评分与存活状态、肿瘤分期(T)、淋巴结状态(N)及临床阶段之间的关系。 统计学、图 C 的 Wilcoxon 检验、图 D-F 的 Holm-Bonferroni 方法比较两组,以及 Kruskal–Wallis 的图 D-F 的比较。G 基于 TCGA 队列中乳腺癌患者,低风险和高风险评分组的 Kaplan–Meier 曲线。统计学,对数排名测试。H 基于 METABRIC 队列中乳腺癌患者低风险和高风险评分组的 Kaplan–Meier 曲线。统计学,两阶段分析。I 冲积图展示了分子簇、风险组与乳腺癌患者存活状况之间的相互关系。J TCGA 队列中总体生存率、风险评分与临床病理特征之间的关系
预后命名图的发展与评估
进行了单变量和多元 Cox 回归分析,以评估风险评分变量的预后显著性,以及年龄、T 期、N 期和 AJCC 期的临床特征(图)。5A)结果表明,风险评分可以有效地作为独立的预后因子。多变量分析后,年龄、AJCC 分期和风险评分被发现为预后的重要因素。这些变量随后被选中构建了命名图,便于预测预后(图 5B)。校准曲线被绘制出来,以展示 1 年、3 年和 5 年存活率通过计录图实现的令人满意的预测一致性。(图 5C)1 年、3 年和 5 年时分别为 0.90、0.80 和 0.75 的 AUC 值表明该计录图能够在训练集中提供准确的预测(见图 5D)。此外,为评估模型在乳腺癌异质性的适用性,作者评估了其在不同 PAM50 亚型中的表现。ROC 曲线显示,所有亚型的 1 年存活预测 AUC 值约为 0.9,5 年存活预测 AUC 值保持在 0.7 以上,支持模型在不同分子亚型间的稳健性。在验证队列中,还评估了该命名图在预测乳腺癌患者 1 年、3 年和 5 年生存期方面的性能(图 5E)。
命名图存活模型的建立与评估。 对 TCGA 队列的临床病理特征和风险评分进行单变量和多变量分析。B 构建预测乳腺癌患者的预后的传记图。C 校准图显示 TCGA 队列中预测的 1 年、3 年和 5 年总体生存概率。D TCGA 队列中受试者工作特征(ROC)分析。METABRIC 队列中对该单位图的 E ROC 分析
肿瘤免疫微环境分析及预后特征在预测药物敏感性方面的有效性
不同风险组间 DEGs 的 GO 和 KEGG 富集分析显示,DEGs 主要与多种免疫反应及细胞因子-细胞因子受体相互作用相关(图)。6A-B)。与此同时,与质膜外侧的相关性与细胞粘附分子的关联,凸显了机械刺激在不同风险组中的作用。这些结果表明两组在机械刺激和免疫反应上存在差异。与生存益处相符,低风险组患者表现出多种浸润免疫细胞的患病率增加,免疫评分较高,肿瘤纯度较低,提示免疫“热”表型(见图 6C-E)。为研究模型与药物敏感性之间的相关性,作者计算了乳腺癌患者每种药物的预测 IC50 值。该景观展示了药物敏感性与风险评分之间的相关性和显著性。作者鉴定了几种临床常用药物,如 5-氟尿嘧啶、palbociclib 和 docetaxel,显示其 IC50 值与风险评分呈正相关(见图 6F)。相反,溴化仙铁铀(一种典型的存活病毒抑制剂)的 IC50 值与风险评分呈负相关(见图 6F)。这些发现表明,被归类为高风险的乳腺癌患者可能对传统化疗治疗有耐药性,但可能对溴化先甲铀(Sepantronium)敏感。因此,Sepantronium brome 在高危乳腺癌患者的治疗管理中具有潜力。
肿瘤免疫微环境分析与药物敏感性预测。A-B 基因本体论(GO)和京都基因与基因组百科全书(KEGG)对低风险和高风险评分组 DEGs 的富集分析。C ssGSEA 结果的热图,涵盖两个风险组。D 箱型图展示了两个风险组之间 22 种免疫细胞类型浸润水平的差异。统计学,威尔考克森检验。*p < 0.05;**p < 0.01;p < 0.001。E 两个风险组在 ESTIMATE 评分、基质评分、免疫评分和肿瘤纯度上的差异。统计学,威尔考克森检验。*p < 0.05;**p < 0.01;p < 0.001。F 箱型图比较 TCGA 队列中高风险组和低风险组药物 IC50 值。统计学,威尔考克森检验。*p < 0.05;**p < 0.01;p < 0.001;p < 0.0001
机械刺激通过重塑乳腺肿瘤的免疫微环境来影响乳腺癌的预后
接着,作者旨在识别肿瘤微环境(TME)中与不同风险亚组表型相关的细胞类型。从 Broad Institute 单细胞门户网站下载了 26 名乳腺癌患者的处理后单细胞测序数据。细胞被聚类并注释为九种主要细胞类型和四十九种亚型(图 7A-B)。
机械刺激通过改变肿瘤的免疫微环境影响乳腺癌预后。A-B UMAP 分析识别出乳腺癌样本中的九种主要细胞类型和四十九种亚型。C 型 UMAP 分析与基于剪刀的风险组相关细胞。D-E 不同主要细胞类型和亚型中细胞的比例与风险评分相关。F–H 对记忆 B 细胞 F、Monocyte_1_IL1B G 和 LAM1_FABP5 H 的 DEG 富集分析,涉及两个风险相关组。I 细胞数量和细胞交流强度的差异与不同风险评分相关。J 网络分析显示推断蜂窝通信网络中风险组间的整体信息流差异。K Circos 图展示了不同风险组相关细胞中 SPP1、OCLN、CDH 和 GALECTIN 信号通路的分布图。L 点图显示不同风险组的代谢评分
为识别与不同风险表型相关的 TME 细胞类型,作者结合训练组患者的 RNA 测序数据及其对应风险组分类,应用了 SCISSOR 算法(见图)。7 与高风险组相比,低风险组表现出较高的 B 细胞存在感和较少的肿瘤细胞(图 7D)。具体而言,低风险组内存 B 细胞、Endothelial_ACKR1 和 Myeloid_cDC2_CD1C 数量增加,而 CD4 + T 调控 cells_FOXP3、Monocyte_1_IL1B 和 LAM1_FABP5 数量减少(图 7E)。这些细胞在基于机械刺激相关特征构建的风险组间表现出差异,暗示可能与机械刺激相关。记忆 B 细胞可以作为抗原呈递细胞,促进记忆和肿瘤相关 T 细胞反应的扩展,从而增强抗肿瘤免疫[42]。LAM1_FABP5 被认为具有免疫抑制作用,并与乳腺癌的生存率较低相关[43]。利用 Metascape 对频率显著差异的细胞亚群进行了进一步富集分析,结果显示两组记忆 B 细胞均与免疫效应过程显著相关(图 7F)[44]。Monocyte_1_IL1B 与机制相关通路(如 ERBB2 − EGFR 信号通路)表现出强烈相关性,该通路被报道促进乳腺癌细胞的增殖和迁移[45](见图 7G)。对其他细胞类型的进一步富集分析显示,这些细胞与炎症反应有显著关联(见图。 7H)。在初步发现机械刺激可能与免疫细胞频率相关后,作者进一步研究其是否影响免疫微环境中的串扰。为此,作者利用 CellChat 分析配体-受体信号的细胞间通信,旨在阐明区分高风险组和低风险组的细胞相互作用。结果显示,低风险组推断相互作用的数量和强度更高(图 7I)。具体来说,在低风险组中,与炎症因子相关的通路如 IFN-II 和 IL6 被富集。在高风险组中,与机械刺激相关的通路,包括分泌磷蛋白 1(SPP1)、隐匿蛋白(OCLN)、卡得蛋白(CDH)和半乳凝集素(GALECTIN)信号通路被富集。这些通路在细胞间相互作用、细胞连接、细胞粘附和细胞-基质相互作用中起着关键作用(见图 7J-K)。低风险组表现出更强的免疫反应,而高风险组的机械刺激可能促进免疫抑制。不同组的代谢评分采用 scMetabolism 计算。结果显示,高风险组的糖链生物合成、氧化磷酸化和戊糖磷酸途径的代谢上调,而低风险组则增强了糖鞘脂和糖胺基聚糖的生物合成(图 7 L)。
TEX19 影响乳腺癌体内和体外的生物行为
据报道,睾丸表达 19(TEX19)在多种癌症中上调,包括膀胱癌和卵巢癌,促进肿瘤进展[46, 47]。在 15 个模型基因中,TEX19 在单变量 Cox 回归中表现出最高的风险比(HR = 1.313),凸显了其对乳腺癌预后可能产生显著影响。此外,在作者的预后模型中,TEX19 被分配为所有基因中系数权重最高的之一。单细胞转录组数据进一步揭示,TEX19 主要表达于肿瘤细胞中,支持其在乳腺癌进展中的生物学相关性。这些计算和转录组发现,加上 TEX19 致癌作用的既有证据,促使作者将其功能验证列为优先。为进一步理解 TEX19 在乳腺癌中的作用,作者生成了 TEX19 基因敲除 MCF-7 细胞系(见图 8A)。西方印迹分析进一步证实,与正常乳腺上皮细胞系 MCF-10A 相比,乳腺癌细胞系(MCF-7、MDA-MB-231、BT-549)中 TEX19 蛋白显著上调(见图 8B)。作者选择了 shTEX19-1,其敲定效果更好,用于后续实验。在增殖分析中,shTEX19 细胞失去了生长能力;然而,shRandom 细胞维持了细胞的存活(见图 8C)。群体分析显示 TEX19 对乳腺癌生长至关重要(图 8D-E)。此外,shTEX19 细胞在 G1 期被抑制,表明 TEX19 对肿瘤细胞增殖至关重要(见图 8F)。在与 shTEX19 癌细胞移植的裸鼠中,肿瘤生长显著受阻(图 8G-I)。综合这些结果表明 TEX19 参与乳腺癌增殖。
TEX19 在体内和体外影响乳腺癌的生物学行为。答:TEX19 和 GAPDH 的表达水平通过 TEX19 敲低处理(shTEX19)和对照(shRandom)MCF-7 细胞的西方印迹法测量。乳腺癌细胞系(MCF-7、MDA-MB-231、BT-549)及正常乳腺上皮细胞系 MCF-10A 中的 B TEX19 蛋白水平,均通过西方印迹法测量。C Tex19 敲低处理及对照(shRandom)MCF-7 细胞的生长曲线。结果以三重实验的平均值±标准差(SD)形式呈现。统计学,双尾学生 t 测试。*p < 0.05;**p < 0.01;p < 0.001;p < 0.0001。在 TEX19 敲低处理和对照(shRandom)MCF-7 细胞中的 D-E 菌落形成测定。 形成的菌落数量被统计,结果以三重实验的平均值 ± SD 表示。统计学,双尾学生 t 测试。*p < 0.05。F 流式细胞术分析显示 shTEX19 对 MCF-7 细胞周期的影响。实验重复了三次。统计学,双因子方差分析。*p < 0.05;**p < 0.01。G 肿瘤大小从第 15 天开始测量。n = 6,统计学,双尾学生 t 测试。*p < 0.05。H 图像展示了裸鼠与 TEX19 敲低处理及对照(shRandom)MCF-7 细胞移植的乳腺肿瘤负荷。n = 6。 我在裸鼠中测量肿瘤体重,时间为第 34 天。数据以六个实验的平均标准差±呈现,并采用未配对学生 t 检验进行分析。*p < 0.05;**p < 0.01;p < 0.001;p < 0.0001。

5+分型+机器学习+单细胞,这个思路学会直接套用,换个疾病轻松上分!

总结

 总之,本研究采用单细胞 RNA 测序和体体 RNA 测序分析,提出了将 MSRGs 纳入乳腺癌的开创性预后特征,特别强调通过重塑免疫微环境可能影响乳腺癌预后的机械刺激。体内和体外实验进一步验证了关键模型基因 TEX19 在推动乳腺癌进展中的关键作用。这些发现为临床管理提供了新颖的视角,为机械线索在乳腺肿瘤生物学中的作用提供了宝贵见解,并凸显了其提升预后准确性和个性化治疗策略的潜力