|
机器学习模型开发与特征基因选择
为了识别关键特征基因并构建 IPF 的诊断模型,作者采用了综合机器学习策略。评估了多种算法组合(见图)。 阿拉伯数字 A),并对其诊断表现进行了多个数据集的评估,包括 GSE185691、GSE199949、GSE24206、GSE53845 和训练队列(GSE213001)。在所有组合中,glmBoost + Lasso 模型在所有数据集中实现了曲线下面积(AUC)最高的,训练集平均 AUC 为 0.945,在独立验证队列中表现出稳健性能。
答:使用 AUC 评估的各种机器学习模型及其组合在多个队列(GSE185691、GSE199949、GSE24206、GSE53845 和训练集)中的表现。B:火山图,显示 IPF 与正常对照组间表达基因差异分布。红色点表示显著上调的基因,蓝色点代表显著下调的基因,黄色星标注选定的关键特征基因进行进一步分析。C:热图展示了七个特征基因在正常对照(NC)和 IPF 患者的表达谱。D:显示丰富 GO 项的气泡图。点大小表示基因计数,颜色强度表示-log10(p 值)。E:显示基因通路关联的弦图。外环颜色表示 GO 类别(粉色:生物过程;蓝色:细胞成分;绿色:分子功能),内紫色部分表示各通路中目标基因的比例
基于该模型,作者鉴定出七个最佳特征基因——补体因子 H(CFH)、ISY1 剪接因子同源基因(ISY1)、LSM6 同源蛋白(LSM6)、多重 RC 结合蛋白 1(PCBP1)、RNA 聚合酶 II 亚基 C(POLR2C)、TIA1 细胞毒性颗粒相关 RNA 结合蛋白(TIA1)和 YBX1,供进一步研究。火山图(图)阿拉伯数字B)和热力图(见图)阿拉伯数字C)说明 IPF 组与正常对照组(NC)组之间这些基因的表达差异。
为阐明所选特征基因的生物学意义,作者直接对该基因集进行了基因本体(GO)富集分析。浓缩分析(图。阿拉伯数字D–E)揭示了与 IPF 致病机制相关的生物过程的关联,包括 RNA 剪接、应激反应、凋亡信号传导以及细胞因子介导的通路 。虽然这些基因本身并非凋亡或免疫信号传导的经典效应因子,但已有研究表明,如 YBX1 和 TIA1 等 RNA 结合和剪接调控因子,可能通过影响转录本稳定性或替代剪接来调节下游过程[59, 60]。Hessman 等人最近的一项研究报告了 YB1 在细胞外发挥新作用,该蛋白与前颗粒素一起,干扰肿瘤坏死因子(TNF)与其受体 TNFR1 的结合[61]。鉴于 TNF 调控多种细胞过程,包括炎症、细胞增殖、分化和凋亡,这一观察暗示 YBX1 具有潜在的免疫调节作用。此外,YBX1 和 TIA1 也被认为参与了 Fas 受体的替代剪接 ,这与凋亡信号直接相关[62, 63]。CFH 作为关键的补体调节因子,也可能通过补体激活通路影响免疫反应[64]。
为验证这些富集结果,作者对代表性通路成分进行了补充的差异表达分析。C-C 基序趋化因子配体 2(CCL2)、C-C 基序趋化因子配体 5(CCL5)、C-X-C 基序趋化因子配体 12(CXCL12)和 C-X-C 基序趋化因子配体 18(CXCL8)显著上调,而 CCR2 则明显下调,这一模式与单核细胞运输增强及有利于 M2 巨噬细胞极化的微环境相符。ECM 相关基因,包括透明质酸合酶 2(HAS2)、Versican(VCAN)、胶原蛋白 I 型α1 链(COL1A1)、胶原蛋白 III 型α1 链(COL3A1)、胶原蛋白 V 型α1 链(COL5A1)以及转化生长因子β3(TGFB3),均显著上调,符合活跃纤维化重塑的特征。在凋亡信号传导中,Caspase 3(CASP3)、Fas 细胞表面死亡受体(FAS)和 TNF 受体超家族成员 10B(TNFRSF10B)显著增加,表明执行者 caspas 的激活。
这些观察表明,尽管这七个特征基因并非这些通路的直接效应者,但它们可能在与上皮存活、免疫调节和纤维化重塑等关键过程交织的调控网络中发挥作用,从而可能促成 IPF 的致病机制。
利用已识别的特征基因集,作者进行了共识聚类以分层 IPF 样本,并鉴定出两种不同的分子亚型(见图)。3A)通过共识矩阵热图、经验累积分布函数(CDF)图和三角洲面积图的综合评估确定了最优聚类数量。结果表明,当 k=2 时,聚类稳定性达到峰值(见图。3 此外,在 k = 2 到 k = 9 之间观察到 CDF 曲线下的相对面积发生显著变化(见图。3C)。主成分分析(PCA)进一步确认了 IPF 亚型 A 和 B 之间的明确区分(见图。3D)。此外,作者还为每个 IPF 样本计算了风险评分。
这是两组 IPF 患者组的结果。 答 :k = 2 时共识聚类热图。颜色渐变表示 0 到 1(白色:0,蓝色:1)。B:Delta 表示当 k=2–9 时 CDF 曲线下区域的相对变化路径。C:累积分布函数(CDF);D:两种 IP 簇图谱表达谱的 PCA 结果,显示不同 IPF 簇间转录组的显著差异。散点图中的红点代表 IPF 群 A,蓝点代表 IPF 群 B。E:使用未配对双尾 t 检验比较簇 A 和簇 B 的预测强迫肺活量百分比(FVC%)。F:利用未配对双尾 t 检验比较 A 群和 B 群块一氧化碳百分比(DLCO%)的预测扩散能力
为进一步阐明分类结果的临床相关性,作者比较了两种 IPF 亚型的肺功能参数。具体评估了预测的强制肺活量百分比(FVC%)和一氧化碳的预测扩散能力百分比(DLCO%)。分析显示,A 群患者 FVC%值略高于 B 群;但该差异未达到统计显著性(见图)。3E, p = 0.15)。相比之下,A 群的 DLCO%显著低于 B 群(图)。3F, p = 0.02),表明该子组气体交换能力的损害更为明显。这些发现表明,所提分类涵盖了临床上有意义的异质性,A 群患者可能代表经历更严重功能衰退的患者亚组。
尽管如此,作者承认某些局限性。两个群组之间观察到的 FVC%差异未达到统计学显著性,且在分析队列中缺乏治疗反应或长期生存数据。因此,尽管作者的亚型分类显示出分子和功能上的明显差异,但仍需在前瞻性临床研究中进一步验证并附有详细结局数据,以确立其完整的预后和治疗相关性。
为探索 IPF 的免疫学格局,作者采用 CIBERSORT 算法配合 LM22 参考矩阵,对整体 RNA 序列进行解卷,并估计 22 个免疫细胞亚群的比例。该方法基于预定义的转录组特征而非单一表面标记,能够稳健推断免疫细胞组分,包括 M0、M1 和 M2 巨噬细胞。如图所示(图。4A–B),IPF 组织中原生 B 细胞、记忆 B 细胞、浆细胞、静息 CD4 记忆 T 细胞、活化 CD4 记忆 T 细胞、滤泡辅助 T 细胞、γδ T 细胞、静息树突状细胞和静息肥大细胞比例升高。相反,静息的 NK 细胞、活化树突状细胞和中性粒细胞在 IPF 中较正常对照组减少。观察到的中性粒细胞减少可能反映了从急性中性粒细胞主导炎症向 IPF 特征性的巨噬细胞和淋巴细胞驱动的慢性重塑转变。人口统计分析进一步表明,IPF 患者年龄显著高于非疾病对照组(平均 63±7 岁对 48 岁±15 年,p = 0.004),这也可能导致免疫谱差异。此外,由于转录组数据来自公开的 GEO 队列,缺乏职业或环境暴露史等详细临床元数据。因此,虽然作者的发现突出了两组之间明显的免疫学差异,但作者也承认未测量的混杂因素,包括环境和职业因素,也可能影响了观察到的免疫格局。
A–B:比较特发性肺纤维化(IPF)患者与正常对照组(NC)免疫细胞浸润水平。统计显著性通过无配对双尾 t 检验确定。C:NC(蓝色)和 IPF(黄色)患者的风险评分比较。IPF 组的风险评分显著高于 NC 组(p3C 0.0001,未配对双尾 t 检验)。D:不同年龄组的风险评分比较,显示老年人(黄色,≥0 岁)和成年人(蓝色,19–59 岁)之间存在显著差异,老年人组的风险评分更高(p< 0.001,未配对双尾 t 检验)。E:基于疾病严重程度的风险评分比较。风险评分在疾病严重度升高时显著增加(p3C 0.0001,单向方差分析)。严重程度包括健康(紫色)、中度(绿色)、重度(天空蓝)和高级(红色)。F:七个特征基因与免疫细胞之间的相关网络。线条颜色表示统计显著性:绿色(p < 0.001)、紫色(0.001 ≤p < 0.01)、黄色(0.01 ≤p < 0.05)和灰色(p ≥ 0.05)。相关性通过皮尔逊相关系分析进行评估。G:免疫细胞亚群与 RiskScore 之间的相关分析。颜色强度表示相关性的强度,线条颜色和粗细表示相关性的大小和重要性(皮尔逊方法,p 值)。*p < 0.05;**P < 0.01;P < 0.001
为进一步剖析七个选定特征基因与 IPF 中免疫细胞浸润的关系,作者进行了相关分析。如图所示。4F、YBX1 表达与 M0 和 M1 巨噬细胞、单核细胞及静息 NK 细胞呈正相关,但与活化树突状细胞和浆细胞呈负相关。CFH 也表现出类似的相关模式。LSM6 和 ISY1 与 M1 巨噬细胞、单核细胞、静息 NK 细胞以及静息和活化的 CD4 记忆 T 细胞呈强正相关,而与浆细胞呈负相关。相比之下,POLR2C 和 PCBP1 与免疫细胞浸润的关联较弱。这些发现表明特征基因可能影响肺微环境中免疫细胞的招募和激活,可能通过免疫调节促进 IPF 的发病机制。
此外,作者引入了一种新颖的评分系统——RiskScore——源自 PCA,旨在捕捉 IPF 的遗传和分子复杂性。利用大批量 RNA-seq 数据集,作者系统评估了 RiskScore 与 IPF 各类临床特征之间的关联,以评估其预后相关性和临床效用。如分析所示,RiskScore 有效地区分了 IPF 患者与健康对照组(见图)。4C)并显示出跨年龄组显著分层(见图。4D)和疾病严重程度(见图。4E)。作者还调查了它与免疫细胞群体的关系(见图)。4 G),强调其在 IPF 免疫致病机制中的潜在参与。综合来看,这些结果强调了 RiskScore 作为区分疾病状态、评估疾病负担以及潜在指导 IPF 管理临床决策的有力工具。
通过 IPF 中 C3 信号重塑 AT2-巨噬细胞串扰
单细胞 RNA 测序(scRNA-seq)分析显示细胞组成存在明显差异(见图)。第一季A)和基因表达谱(图。第一季C)断联患者与 IPF 患者之间的联系。如图所示。第一季B,IPF 组中不同细胞类型的相对比例显著改变。值得注意的是,巨噬细胞群体表现出明显的变化,尤其是在 M0 和 M2 亚型中,这很可能反映了纤维化进展常见的炎症。成纤维细胞在 IPF 样本中显著富集,这与其在细胞外基质生成和组织重塑中既定作用相符。肺泡 II 型(AT2)细胞数量显著减少,凸显上皮完整性受损。
鉴于 AT2 细胞在维持肺泡稳态中的关键作用,其丧失带来了幸存的 AT2 亚群可能发生功能重编程并主动重塑局部免疫环境的可能性。为验证这一假设,作者对 scRNA-seq 数据应用了 CellChat 分析,以绘制细胞间通信网络,特别关注上皮细胞与巨噬细胞的相互作用。
结果揭示了 IPF 中细胞间通信的显著重塑。信号相互作用的数量和强度均显著增加(见图)。5A–B),形成了比 NC 更密集、更复杂的通信拓扑结构。在免疫谱系中,巨噬细胞介导的信号传导表现出最显著的增强(见图。5C),表明巨噬细胞在增强局部免疫反应和纤维化中起着核心作用。
答:比较细胞间相互作用数量及其相互作用强度,分别是 NC 和 IPF 样本。B:热图显示 NC 和 IPF 样本间细胞间通信差异,包括交互次数和相互作用强度,按细胞类型分层。C:气泡图,展示 NC 和 IPF 样本中不同单元类型中输入(接收)和发出(发送)信号强度。D:两组细胞间通信中补体信号通路的活性差异。E:IPF 中 C3 信号通路的改变,特别是在巨噬细胞、AT2 细胞和上皮细胞之间的相互作用中。F:IPF 中配体-受体对 ITGAX+ITGB2 的变化,突出巨噬细胞与 AT2 细胞间增强的相互作用
特别值得关注的是,补体信号在 IPF 中被强力上调,显著促进了 AT2 细胞与巨噬细胞之间的相互作用(见图。5 鉴于 AT2 细胞在肺泡修复中的关键作用,增强与免疫细胞的交叉作用可能加剧炎症并促进纤维化。在补体通路中,C3 信号轴在 IPF 中显著被激活(见图。5E),在巨噬细胞、AT2 细胞及其他上皮细胞类型的相互作用中观察到活性增强。这些发现表明补体系统可能作为免疫反应和纤维化发育在 IPF 中的关键调节因子。
进一步分析发现了由 C3 受体介导的特定信号相互作用——即 ITGAX 和 ITGB2——在 AT2 细胞与 M2 巨噬细胞亚群之间(见图)。5F)。这种相互作用意味着 AT2 细胞可能通过 C3 依赖信号直接与 M2 巨噬细胞接触,可能加速纤维化进程。这些结果凸显了 AT2 细胞在协调免疫细胞招募和通过特定配体-受体途径扩增纤维化方面这一此前被低估的角色,对治疗靶向具有重要意义。
为补充人类 IPF 肺部的研究结果,作者对公开的单细胞 RNA 测序(scRNA-seq)数据进行了深入分析,该数据源自由博来霉素(BLM)诱导的肺纤维化小鼠模型(GSE240134)。该数据集包括野生型(WT)、第 14 天(BLM14)和第 28 天(BLM28)治疗后组,提供了纤维化进展期间肺泡巨噬细胞(AM)重塑的动态视图。
无监督聚类法鉴定出两个主要的 AM 亚群:组织驻留 AM(TR-AMs)和单核细胞来源 AMs(Mo-AMs)(图。6A)定量分析表明,Mo-AMs 在 BLM14 显著扩展,同时 TR-AMs 显著减少。到 BLM28 时,TR-AM 表现出部分恢复,而 Mo-AMs 仍保持较高(见图。6B)。使用弹弓进行轨迹分析(见图。6C)和 StaVia(见图)6D) 持续显示从 Mo-AM 向 TR-AM 的分化轨迹,凸显 AM 亚群在纤维化损伤反应中的动态可塑性。
基于 BLM 诱导肺纤维化小鼠模型的 AMs 的 SnRNA 测序分析。 答 :UMAP 对 AMs 的可视化识别出两个主要亚群:组织常驻 AMs(TR-AMs)和单核细胞来源 AMs(mo-AMs)。B:WT、BLM14 和 BLM28 组 TR-AM 和 Mo-AM 的比例变化。Mo-AM 在 BLM14 显著扩张,伴随着 TR-AM 显著减少,而在 BLM28 部分 TR-AMs 恢复。C–D:使用弹弓(C)和 StaVIA(D)进行轨迹分析,显示 Mo-AMs 向 TR-AMs 的分化轨迹,表明纤维化进展过程中巨噬细胞具有动态可塑性。E:沿弹弓谱系 1 的基因动态热图显示,在 Mo-AM 到 TR-AM 的过渡过程中,Trem2、apoe、Ccl2、Ccl3、Ccl4、Ccr2、Ccr5 和 Cx3cr1 的逐步下调。去氧酶富集分析强调了与白细胞迁移、趋化性、病毒防御和补体激活相关的生物过程。F–O:TR-AMs 和 Mo-AM 代表性基因的差异表达分析。Trem2、apoe、Ccl2、Ccl3、Ccl4、Ccr2、Ccr5、Cx3cr1 和 Ybx1 在 Mo-AMs 中优先表达,而 C3 在 TR-AM 中选择性上调
谱系分析(见图)6E)发现一组炎症性和趋化性基因——包括 Trem2、Apoe、Ccl2、Ccl3、Ccl4、Ccr2、Ccr5 和 Cx3cr1——主要表达在 Mo-AMs 中,并且在 Mo-AM 到 TR-AM 的过程中呈递减趋势。基因本体富集表明,这些基因在病毒反应、白细胞介导免疫、巨噬细胞迁移、趋化性和补体激活等生物过程中得到富集,表明早期纤维化阶段的 Mo-AM 协调白细胞招募和炎症扩增。
一个特别值得注意的发现是 TR-AMs 中观察到 Ybx1 和 C3 表达的明显互惠模式(图)。6F–O)。具体而言,TR-AMs 表现出 Ybx1 显著下调,同时 C3 显著上调。这一模式与作者在人类 scRNA-seq 数据中的观察相呼应,其中 YBX1 下调与纤维化肺中 C3 表达增加同时出现,支持物种间 YBX1–C3 调控轴的保守性。相比之下,Mo-AMs 表现为 Ccl2、Ccl3 和 Ccl4 等趋化因子水平升高,凸显其在免疫细胞招募和早期炎症扩增中的作用。综合这些发现表明,虽然 Mo-AMs 通过趋化因子信号促进炎症环境,而 TR-AMs 可能通过 YBX1–C3 轴维持补体激活,从而延续免疫-上皮的串扰和纤维化重塑。
为研究 AT2 细胞在 IPF 中的异质性及潜在功能作用,作者进行了亚型分类,识别出七个不同的 AT2 亚群(AT2(1)至 AT2(7))(见图)。7A)这些亚型的比例在 NC 和 IPF 样本间差异显著,表明存在疾病特异性的细胞重编程。值得注意的是,AT2(3)和 AT2(4)在 IPF 组织中显著富集(见图)。7B),表明它们可能参与疾病发病机制。
答:基于基因表达谱对 AT2 细胞亚型(AT2(1)至 AT2(7))进行 UMAP 投影。每个子类型用不同的颜色表示,显示出 UMAP 空间中的明显分离。B:条形图,显示 IPF 组和 NC 组 AT2 亚型的相对比例。D:在 AT2 细胞群体中,UMAP 对特征基因 AUCell 分数的热图叠加显示,某些 AT2 亚型,特别是 AT2(1)和 AT2(2)的 AUCell 分数更高。E:AT2 标记基因的基因本体(GO)富集分析。每条条代表特定 AT2 亚型的富集生物过程。条形长度表示显著性水平(−log10(q 值))。F:细胞分化潜力显示的 CytoTRACE 分析。G-H:通过 Slingshot/Palantir 和 PAGA 算法推断的细胞轨迹和网络拓扑。箭头指示潜在的分化路径,展示了细胞状态的相互关联及其在肺组织发育和疾病进展过程中的演化。I-J:基于 Palantir 识别关键发育分支(I)及 YBX1 表达(J)动态变化。K–N:StaVIA 揭示发育分支结构(K),识别关键分支点(L),并描绘 YBX1 在不同轨迹(M–N)上的表达动态
接着作者检查了上述 AT2 亚型中先前定义特征基因集的表达(见图。7C)并利用 AUCell 评分评估其转录活性(见图。7D)。该基因组在 AT2(1)和 AT2(2)中表现出高活性,但在 AT2(3)和 AT2(4)中被大幅抑制,这意味着在维持正常细胞功能中起着关键作用。基因本体(GO)富集分析显示,AT2(1)和 AT2(2)在代谢通路中高度富集,特别是线粒体翻译和基因表达,表明它们代表了对肺泡稳态至关重要的代谢活跃群体。AT2(6)和 AT2(7)富含氧化磷酸化和线粒体呼吸链组装途径,表明其在能量代谢和线粒体功能中起关键作用。相比之下,AT2(5)在 RNA 加工、剪接和代谢通路中表现出显著富集,暗示其在转录后 RNA 修饰和纤维化微环境中的细胞应激反应中可能起调控作用。
AT2(3)细胞与氧化应激反应、抗原处理及呈递途径相关,表明免疫功能激活并参与局部炎症环境的调节。AT2(4)细胞富含与上皮发育和环境反应相关的通路,包括对氧化应激、病原体暴露和组织损伤的适应,表明其为由疾病刺激诱导的反应性 AT2 亚型(见图)。7E).
使用 CytoTRACE 进行发育状态分析显示,AT2(1)具有最高的分化潜力,表明它代表了一个类祖细胞的群体(图)。7F)。作者采用 Slingshot 算法重建 AT2 细胞的分化轨迹,识别出多个谱系分支,起源于 AT2(1),并向其他亚型发展,包括 AT2(2)和 AT2(4)(图 7 G)。Palantir 算法进一步验证了这一点,该算法细化了伪时间推断,并划定了代表性分化分支(例如,F03708_GGGCACTCCTGAGATC),揭示了细胞状态中的连续跃迁。值得注意的是,转录调控因子 YBX1 在伪时间轨迹上表现出动态且时间依赖的表达模式(见图。7I–J),暗示在命运决定中可能起到调控作用。
为了进一步整合谱系转变与细胞命运决策,作者应用了 StaVIA 算法来可视化分化流动态。分析揭示了两条主要轨迹:一条朝向 AT2(2),另一条走向 AT2(4)(见图)。7 其中,谱系分支 6 和 12 是导致 AT2(4)分化的代表性路径(见图。7 公升)。空间聚类模式(左侧面板,图)。5 M)和 YBX1 表达梯度(右侧面板,图。7 M)共同证明了 YBX1 表达的空间异质性。在这两种伪时间轨迹中,YBX1 表达呈现双相趋势——最初下降后再次上升(见图)。7N)——表明其参与了 AT2 命运决策和子类型规范的早期调控。
总之,作者的研究阐明了 IPF 中 AT2 细胞广泛的异质性和功能多样性。观察到的发育轨迹和转录重编程的变化凸显了这些细胞在纤维化应激下的动态可塑性。YBX1 作为一个潜在的关键调控因子,协调了从前体向功能上不同的 AT2 亚型的转变。这些发现为 IPF 中上皮损伤、异常修复和肺泡再生的机制提供了新颖见解,并识别出有前景的治疗干预靶点。
孟德尔随机化分析揭示了 YBX1 在肺功能中的因果作用
为探讨YBX1 与肺功能之间的潜在因果关系,作者采用一秒内用力呼气量(FEV₁)和强迫肺活量(FVC)作为结局特征,进行了孟德尔随机化(MR)分析。这些分析旨在阐明 YBX1 在 AT2 细胞功能分化中的作用,特别是在肺纤维化的病理生理背景下。
对于 FEV₁,MR 分析显示YBX1 表达呈阳性相关(见图。8A–C)。反方差加权(IVW)方法估计比值比(OR)为 1.055(95% CI:1.028–1.082),表明 YBX1 表达增加与肺功能改善相关。MR-Egger 方法的比值为 1.045(95% CI:0.977–1.118),与原假设一致,但方向性上与 IVW 估计相符。加权中位数方法显示出统计学显著的相关性(OR = 1.047,p = 0.007),强化了 YBX1 对肺功能潜在的有益影响。
一个: 对 YBX1 和 FEV1 进行 IVW 回归分析,显示 YBX1 对 FEV1 的因果效应。B:YBX1 和 FEV1 的 MR 分析,展示了 IVW、MR Egger、简单模式和加权模式的回归估计值。C:YBX1 对 FEV1 在不同 MR 方法中的因果效应估计,包括比值比(OR)及其 95%置信区间。D: 对 YBX1 和 FVC 进行 IVW 回归分析,显示 YBX1 对 FVC 的因果效应。E:YBX1 和 FVC 的 MR 分析,展示了 IVW、MR Egger、简单模式和加权模式的回归估计值。F:YBX1 对不同 MR 方法中 FVC 的因果效应估计,包括比值比(OR)及其 95%置信区间
同样,FVC 的 MR 分析支持YBX1 表达呈正因果关系(见图)。8D–F)。IVW 方法的比值为 1.059(95%置信区间:1.033–1.085),表明对整体肺活量具有保护作用。尽管 MR-Egger 估计未达到统计显著性(OR = 1.034,95% CI:0.971–1.102),但加权中位数方法显示出强健的关联性(OR = 1.053,p < 0.001),进一步证实 YBX1 在维持肺功能中的作用。
为评估这些发现的稳健性,作者进行了水平多效性和异质性的测试。FEV₁和 FVC 的 MR-Egger 截断未具统计学意义(p = 0.56 和 p = 0.82),表明水平多效性影响极小。此外,所有 MR 方法的异质性检测均未发现显著不一致(p > 0.05),支持结果的稳定性和可靠性。
结合这些遗传发现与 IPF 中 AT2 细胞的功能异质性和轨迹动态,作者提出 YBX1 作为关键发育调控因子发挥作用。它可能通过转录重编程引导 AT2 细胞从前体状态向疾病相关的功能亚型发展。YBX1 的这种调控作用在病理条件下的上皮修复和再生中可能至关重要。综合来看,作者的 MR 分析提供了遗传证据,支持 YBX1 在肺功能中的因果作用,并对其作为纤维化性肺病治疗靶点的潜力具有启示意义。
多中心数据和体外实验揭示了 IPF 中 YBX1 的表达模式
本研究中,作者确定 YBX1 在 AT2 细胞的细胞应激反应和损伤修复中具有潜在作用,尤其是在 IPF 的病理条件下。为验证该假设,作者采用多中心转录组分析和体外实验验证 IPF 相关 YBX1 表达的变化。
多中心数据分析(图。9):为评估 IPF 中的 YBX1 表达,作者整合并分析了四个独立公开的转录组数据集(GSE213001、GSE199949、GSE53845 和 GSE185691)。在所有数据集中,IPF 患者的肺组织 YBX1 表达显著下调,较 NC 为高。GSE213001 中,YBX1 表达下降最为显著(p < 0.0001)。其他三个数据集也观察到类似趋势,均达到统计显著性(p < 0.01)。森林效应大小和置信区间图进一步证实了 IPF 和 NC 样本在不同数据集中 YBX1 表达的平均差异,表明 YBX1 在 IPF 中具有一致的生物学作用。该结果在多个独立队列中的可重复性强调了 YBX1 作为候选生物标志物或治疗靶点的潜力。
A–D:小提琴图(左侧面板)展示了 IPF 患者肺组织样本中 YBX1 基因表达水平在四个独立数据集中的分布:(A)GSE213001,(B)GSE199949,(C)GSE53845,(D)GSE185691。对应的估计图(右侧面板)展示了 IPF 组和 NC 组 YBX1 表达的平均差异,每个点代表一个独立样本。横线表示组别均值,垂直误差条代表均值差的 95%置信区间。在所有数据集的 IPF 样本中,YBX1 均有一致且统计学上显著的下调。统计显著性采用无配对双尾 t 检验评估
体外验证:西方印迹分析(图。10A)显示博来霉素处理的 MLE-12 细胞中 YBX1 蛋白水平显著下降,GAPDH 作为负荷对照。定量分析证实了这一减少,明确表明博来霉素对 YBX1 蛋白表达的抑制作用。补充的 qPCR 结果(图。10B)显示博来霉素处理细胞中 YBX1 mRNA 水平也相应下降,进一步支持 YBX1 在纤维化条件下显著下调的结论。图10.
答:西方墨迹分析显示正常对照(NC)和博来霉素处理(BLM)细胞中 YBX1 蛋白水平,GAPDH 作为负荷对照。B:定量 PCR 结果显示 NC 组和 BLM 组 YBX1 的相对 mRNA 水平
总之,多中心转录组分析与体外细胞建模的整合为 IPF 中 YBX1 下调提供了有力证据。这种一致的表达模式——无论是在患者肺组织还是纤维化损伤模型中都观察到——强烈支持 YBX1 在 IPF 发病机制中的潜在调控作用,并凸显其作为前瞻性诊断生物标志物或治疗靶点的价值。
YBX1 通过调控线粒体功能,增强 AT2 细胞的氧化应激耐受性
通过一系列机制实验,本研究阐明了 YBX1 在博来霉素诱导氧化应激下的关键作用,尤其是在肺泡 II 型(AT2)细胞(MLE-12)中。数据显示,YBX1 显著影响线粒体健康和代谢活动,为其在细胞稳态和损伤适应中的功能提供了新的机制性见解。
YBX1 对 AT2 细胞线粒体健康的影响:利用 JC-1 染色,作者评估线粒体膜电位(MMP)以评估线粒体功能。在过度表达 YBX1 的 AT2 细胞中,博来霉素处理后红色荧光仍占主导(见图。11A),表明 MMP 和线粒体完整性得以保存。相比之下,YBX1 敲低导致荧光转向绿色荧光,反映显著的 MMP 损失和线粒体功能障碍(见图)。12A)这些发现证实了 YBX1 在氧化应激下线粒体稳定性的保护作用。
研究 YBX1 过表达在细胞对氧化应激反应中的作用。 答 :使用 JC-1 染料进行线粒体膜电位分析。图示显示了在正常(NC)和博来霉素(BLM)处理条件下,YBX1 和对照细胞过度表达的细胞线粒体膜电位。红色荧光(JC-1 聚集体)表示线粒体膜健康完整,而绿色荧光(JC-1 单体)则表示去极化。YBX1 过度表达的细胞中红绿荧光比更高的,表明线粒体在氧化应激下具有更好的完整性。B:活性氧物种(ROS)的产生。该图像捕捉了细胞中 ROS 产生时的荧光强度。在使用博来霉素处理的细胞中 YBX1 的过度表达显示出荧光强度保持,表明 YBX1 的过度表达可能减缓 ROS 产生并促进氧化应激的韧性。C:ATP 含量测量。图表显示了处理后细胞中的 ATP 水平,表明 YBX1 的过度表达在一定程度上保护了博来霉素引起的 ATP 消耗,使细胞在压力下保持更高的能量水平
探索 YBX1 敲低对细胞氧化应激反应的影响A:使用 JC-1 染料进行线粒体膜电位分析。图示了在正常和博来霉素处理条件下,YBX1 敲低(si-YBX1)细胞的线粒体膜电位。si-YBX1 + BLM 处理细胞中绿色荧光增加,突出线粒体去极化增强,表明线粒体功能异常显著。B:活性氧物种(ROS)的产生。本面板展示了细胞中 ROS 生成的荧光成像。YBX1 的降序,尤其是在博来霉素处理后,荧光强度显著增加,反映出 ROS 产生增强。这种增加信号增加了氧化应激和细胞损伤,凸显了 YBX1 对抗氧化应激的保护作用。C:ATP 含量测量。该图表量化了 ATP 水平,显示博来霉素处理后 YBX1 敲低的细胞数量显著下降。这一下降凸显了 YBX1 在支持 ATP 合成和整体线粒体韧性方面的关键作用,尤其是在氧化应激条件下
YBX1 对 AT2 细胞 ROS 生成的影响:测量了活性氧水平以评估氧化应激。暴露博来霉素后YBX1-overexpressing细胞的 ROS 积累显著减少(图。11B),表明 YBX1 通过限制自由基的产生来减弱氧化应激。相反,在相同条件下,YBX1 缺乏细胞的 ROS 水平显著升高(见图。12B),强调 YBX1 在氧化还原平衡和氧化损伤缓解中的调控作用。
YBX1 对 AT2 细胞 ATP 产生的影响:ATP 定量提供了细胞能量代谢的读数。与对照组相比,YBX1-overexpressing 博来霉素处理后 AT2 细胞保留的 ATP 水平更高(图)。11C),表明 YBX1 在维持能量稳态中具有保护作用。相比之下,在相同条件下,YBX1 缺失细胞的 ATP 水平显著下降(见图。12C),进一步证明了 YBX1 在维持线粒体功能和能量储备中的重要性。
综合来看,这些结果表明 YBX1 在 AT2 细胞中在氧化应激条件下发挥关键保护作用。通过保持线粒体膜电位、抑制 ROS 生成和维持 ATP 的产生,YBX1 增强了 AT2 细胞的氧化应激耐受性。
本研究采用计算机辅助虚拟药物筛查技术,系统性评估药品银行数据库中 FDA 批准的药品库,旨在识别能够靶向并激活 YBX1 蛋白的小分子化合物。最初的筛选库包括来自 DrugBank 数据库的 2,648 种小分子药物。经过数据预处理(包括格式转换和完整性检查),保留了 2,496 个有效药物分子以供后续分析。该方法相较传统方法具有显著优势:首先,计算机模拟能够快速筛选数千种已知药物,显著缩短研发周期;其次,这些药物已通过 FDA 的安全审查,使其能够直接进入临床验证阶段;最重要的是,这项技术能够精确分析药物与 YBX1 之间的相互作用,为新型抗肺纤维化药物的开发提供关键见解。结合结果(补充数据表7)显示,奥马维洛索隆(结合能:−16.24 kcal/mol)在所有测试分子中表现出最强的 YBX1 结合能力。结合模式分析表明该分子稳定地占据 YBX1 的活性区,可能通过变构效应激活蛋白质功能。
为进一步验证通过虚拟筛选鉴定的 Omaveloxolone 与 YBX1 的结合能力,进行了 100 纳秒分子动力学模拟 Omaveloxolone-YBX1。对模拟轨迹进行了多维参数分析,包括 RMSD、Rg、质心距离、氢键、埋藏 SASA、自由能景观和 MM-PBSA 结合能,系统评估了该复合物的稳定性和结合机制,为其作为 YBX1 激活剂的潜力提供了理论支持。
均方根偏差(RMSD)是衡量两个分子结构差异的常用方法,通过比较对应原子的空间坐标计算得出。它反映了两分子的构象相似性,并在模拟过程中跟踪复合物的结构变化,观察这些变化是否稳定。RMSD 越低,结构相似度越高。如图所示。13 答,复合物的 RMSD 在 0 到 40 纳秒之间显著波动,表明小分子逐渐从初始结合位点解离并重新与蛋白质结合。40 纳秒后,RMSD 稳定,表明与蛋白结合的小分子达到平衡。
YBX1–马维洛克松复合物 A 的分子动力学模拟结果:RMSD,配合物在 100 纳秒内,显示结构偏移和平衡相;B: 复形的回转半径(Rg),反映整体的紧凑性和稳定性;C: 蛋白质残基的 RMSF 谱,在模拟过程中识别柔性和刚性区域;D: 配体质心与蛋白质质心或结合位点之间的距离,显示配体的运动和再结合行为;E: 埋藏溶剂可及表面积(埋藏 SASA),代表蛋白质与配体之间的埋藏界面;F: 代表性配体构象叠加在蛋白质表面,展示了 40 纳秒前后两个主要结合位;G: 以 RMSD 和 Rg 为反应坐标构造的复形自由能景观(FEL),表明两个局部极小值和一个全局最小能态;H:MM-PBSA 能量分解分析,显示每残基对总结合自由能的贡献并识别关键相互作用残基; 我: 配体与蛋白质之间氢键随时间变化的数量,表明键的动态和稳定性;J: 氢键频率分析,左侧面板显示供体-受体对及占用率,右侧面板显示形成频率,作为密度图;K: 配体与蛋白质残基在稳定构象中的关键相互作用,包括氢键、烷基相互作用和范德华力
回转半径(Rg)是分子中所有原子相对于质心的均方根距离,反映了分子内原子的分布。它是测量蛋白质-小分子复合物紧凑性的重要参数。较小的 Rg 值表示结构更紧凑,而较大的 Rg 值则表示结构更松散。如图所示。13B,复形的 Rg 在 40 纳秒后稳定,表明复形结构保持稳定。
均方根波动(RMSF)通过分析氨基酸残基在模拟轨迹上的波动程度,量化蛋白质中单个氨基酸残基的灵活性。它是识别分子内柔性和刚性区域的关键参数。如图所示。13 使用 C,RMSF 评估蛋白质的局部动态特性。
为了分析小分子在蛋白质表面的动态行为,研究了小分子质心与初始结合位点残基及蛋白质整体质心之间的距离变化。如图所示。13D,小分子与蛋白质中心之间以及分子与结合位点之间的距离显著波动发生在 40 纳秒之前,表明小分子已脱离初始结合位点。40 纳秒后,这些距离逐渐稳定,表明小分子与蛋白质的结合已趋于稳定。
埋藏溶剂可及表面积(埋藏 SASA)评估分子区域在复合物内被埋藏且无法被溶剂接触的程度。埋藏 SASA 值越大,分子间的相互作用越强,接触面积越大。如图所示。13E,埋藏的 SASA 在 40 纳秒后稳定,表明小分子与蛋白质之间的接触面积变得稳定,从而使结合更稳定。
模拟轨迹被处理并叠加构象,如图所示。13 岁,女。小分子被分散在蛋白质表面,并识别出两个主要结合位点,分别对应 40 纳秒前后的构象状态。自由能景观(FEL)是利用配合物的 RMSD 和 Rg 作为反应坐标构建的,如图所示。13G。观察到两个局部能量极小值,分别对应小分子从初始结合位点解离和重新结合。最终系统达到全局能量极小值,表明构象在 40 纳秒后稳定。
氢键是蛋白质-配体结合的关键力之一,与静电相互作用密切相关,反映结合强度。如图所示。13I,小分子与蛋白质之间的氢键数量在 0 到 2 之间波动。氢键频率分析显示,小分子在结合位点形成了带有特定氨基酸残基的高频氢键,这很可能在结合过程中起关键作用。无花果。13J(左面板)显示氢键对的供体、受体和占位,右面板显示氢键形成频率,较密集的线条表示频率较高。结果表明氢键相互作用在 40 纳秒后趋于稳定。
对于稳定相的模拟轨迹,采用分子力学-泊松玻尔兹曼表面积(MM-PBSA)计算,以确定结合能,考虑 RMSD、Rg、距离、埋藏 SASA 和相互作用能等因素。计算结果(见表1)显示,小分子与蛋白质之间的ΔEMMPBSA 为−44.862±2.085 kJ/mol,表明强烈的结合亲和力。在组分能量分析中,范德华相互作用能(ΔEvdw)高于静电相互作用能(ΔEele),静电作用和疏水相互作用(ΔEnonpol)则相当。这表明范德华力对结合贡献最为显著,静电和疏水相互作用则起次要作用。结合能分解分析见图。13H,其中对结合能有显著贡献的关键氨基酸包括 ASP-59 和 THR-60。
选取了模拟稳定阶段的构象进行结构分析。如图所示。13K,这种小分子与 LEU-40 形成氢键,也参与烷基疏水相互作用。其他残基如 VAL-39、ASN-58 和 ASP-59 参与范德华相互作用。这些非共价相互作用共同稳定配体与结合位点的结合。
总结
总体而言,这项研究不仅加深了作者对 YBX1 在 IPF 发病机制中作用的理解,也为其作为治疗靶点的发展奠定了坚实基础。通过整合生物信息学、单细胞组学和结构生物学策略,作者建立了系统化框架,探索新靶点和药物筛选,为复杂肺病 IPF 的精准治疗提供了新见解和理论支持
|