导语

 

结果:

6+网络毒理学+机器学习++单细胞+分子对接,优先推荐思路,发文效果明显!
3.1. 空气污染与牛皮癣之间的流行病学证据
作者系统地回顾了现有的流行病学研究,评估了空气污染对银屑病风险或发作的影响。在来自中国、欧洲和美国的多个独立队列中,包括英国生物样本库和 PEGS 队列,长期或短期暴露于 PM₂.₅、PM₁₀、NO₂和相关污染物一直与银屑病发病率增加或症状恶化相关。例如,Wu 等人(2024 年) 证明,在英国生物样本库中,长期接触 PM₂.₅ 会显着增加牛皮癣发病风险(HR 2.01,最高四分位数与最低四分位数),在遗传易感性高的个体中观察到协同效应。同样,Lan 等人(2023 年) 和 Bellinato 等人(2022 年) 报告说,银屑病门诊就诊次数增加,PASI 评分因污染物水平升高而恶化。这些发现为银屑病中空气污染引起的免疫失调的合理性提供了现实世界的支持,与作者研究中确定的分子和通路水平特征一致。
3.2 选定空气污染物的毒理学分析
为了评估环境化学品的潜在皮肤相关毒性,选取了 7 种具有代表性的空气污染物进行分子描述符评价,包括苯、CO、NO、NO₂、O₃、SO₂和甲苯。值得注意的是,CO、O₃ 和 SO₂ 的皮肤致敏评分最高(分别为 1.00、1.00 和 0.99),而 NO 和 O₃ 表现出氧化应激反应元件 (SR-ARE) 通路的激活升高(分别为 0.52 和 0.43)。苯和 NO 在基质金属蛋白酶相关 (SR-MMP) 通路中表现出中等活性,这与组织重塑和炎症有关( 表 1)。这些结果为所选污染物的免疫毒性和皮肤损伤潜力提供了计算支持。
3.3 污染物-银屑病交叉基因的鉴定
从比较毒理学基因组学数据库(CTD) 中检索了总共 1596 个与选定空气污染物相关的人类基因,同时根据它们在至少三个来源的复发情况,从 5 个疾病数据库中提取了 150 个银屑病相关基因。这些基因集的交集产生了 51 个共享基因,表明空气污染物暴露与银屑病发病机制之间存在潜在的分子联系( 图 1, 图 2A)。
图 1.研究设计和分析框架概述。PM,颗粒物;SO₂、二氧化硫;NO₂、二氧化氮;O₃,臭氧;NO,一氧化氮;CO、一氧化碳;挥发性有机化合物,挥发性有机化合物;CTD,比较毒理学基因组学数据库;OMIM,人类在线孟德尔遗传;GWAS,全基因组关联研究;GEO,基因表达综合;套索,最小绝对收缩和选择运算符;脊,脊回归;Enet,弹性网;Stepglm,逐步广义线性模型;XGBoost,极致渐变提升;RF,随机森林;GBM,广义提升回归建模;plsRglm,广义线性模型的偏最小二乘回归;LDA,线性判别分析;SVM,支持向量机;PPI,蛋白质-蛋白质相互作用。
图 2.综合网络毒理学和富集分析,确定关键污染物-银屑病相互作用靶点。(A) 维恩图显示了牛皮癣相关靶标与与七种结构定义的空气污染物相关的靶标之间的交集基因。(B)相交基因的蛋白质-蛋白质相互作用(PPI)网络,使用 cytoHubba 插件由最大集团中心性(MCC)优先处理顶部枢纽基因。(C-E)相交靶点的基因本体(GO)富集结果,分别分为生物过程(BP)、分子功能(MF)和细胞成分(CC)。(F) 京都基因与基因组百科全书 (KEGG) 通路富集分析揭示了可能介导污染物诱导的银屑病风险的信号通路。(G) 医学主题词 (MeSH) 过度代表性分析可视化为网络,以突出显示与目标集相关的丰富疾病和生物学术语。
3.4. 基于网络的核心目标识别
共鉴定了 51 个空气污染物相关靶标和银屑病相关靶标之间共享的交叉基因,并将其导入 STRING 数据库进行蛋白质-蛋白质相互作用 (PPI) 分析,置信度评分截止值为 0.4。去除未连接的节点后,保留了 45 个基因,并在综合 PPI 网络中可视化。使用 Cytoscape 和 MCC 算法进行的进一步拓扑分析突出了几个免疫相关的中心基因,包括 TNF、IL6、IL1B、IFNG、JAK1 和 STAT3,表明炎症信号级联反应的核心作用( 图 2B)。
功能富集分析显示,这些核心靶点主要参与细胞因子介导的信号传导、适应性免疫反应和炎症调节,在 JAK-STAT 和 IL-17 信号通路中显著富集( 图 2C-F)。值得注意的是,包括 S100A9、IL4R、NOS2 和 JAK1 在内的多个基因参与这些典型免疫途径,表明它们在介导牛皮癣中污染物诱导的免疫激活中发挥潜在作用。此外,MeSH 过度代表性分析突出了 Th1/Th2 细胞、白细胞介素信号传导和细胞因子受体等关键免疫学主题,进一步强调了污染物诱导的免疫失调在银屑病发病机制中的潜在作用( 图 2G)。
3.5. 基于机器学习的关键诊断基因鉴定和模型开发
为了优先考虑将空气污染物与牛皮癣联系起来的稳健诊断生物标志物,作者实施了一个全面的机器学习管道,其中包含 12 种算法,系统地组合以生成 113 个预测模型。在评估的机器学习策略中,glmBoost+Ridge 模型在所有四个数据集中始终优于其他模型,根据包含 AUC、灵敏度和特异性的加权性能公式获得了最高的综合分数.该模型产生了一个由 12 个关键基因组成的最小但稳健的基因特征:IFNG、S100A9、TGFB1、BSG、JAK1、FASLG、CCL20、IL4R、IL24、NFKB1、AHR 和 NOS2。这些基因被优先用于下游解释、分子对接和生物学相关性评估。最终模型实现了很高的预测准确性,在训练数据集中的 AUC 为 0.894(95%CI:0.850–0.931),并在三个独立队列中实现了稳健的外部验证:GSE14905(AUC = 0.911)、GSE83582(AUC = 0.914)和 GSE52471(AUC = 0.966)( 图 3B-E)。
图 3.使用污染物相关免疫特征开发和验证基于机器学习的牛皮癣诊断模型。(A)模型开发工作流程概述,包括输入基因选择、12 种算法训练以及 113 种组合的性能评估。(B-E)训练数据集和三个独立验证队列(GSE14905、GSE83582 和 GSE52471)中性能最佳模型(glmBoost + Ridge)的受试者工作特征(ROC)曲线,显示出稳健的辨别力(AUC 0.894–0.966)。(F) 决策曲线分析 (DCA) 表明最终模型在一系列阈值概率范围内具有优越的临床净收益。(G) 校准曲线显示预测概率与验证集中观察到的结果之间高度一致。(H)基于 12 基因模型构建的列线图,用于个体化风险预测。(I-K)验证数据集中单个模型基因的 ROC 曲线;仅显示曲线下面积 (AUC) > 0.7 的曲线下面积。
为了进一步评估模型的可靠性和临床适用性,基于 12 基因组的决策曲线分析(DCA)显示,与默认策略相比,在广泛的阈值概率范围内将所有个体或没有个体分类为病例,具有更高的净收益( 图 3F)。校准图显示,预测概率与实际结果非常接近,表明模型校准是有利的( 图 3G)。
从最终模型构建列线图,以便能够使用 12 个基因的表达值对银屑病风险进行个体化预测( 图 3H)。对三个验证队列的进一步 ROC 分析表明,来自 12 个基因组的几个单独基因表现出强大的诊断性能。值得注意的是,S100A9 在所有数据集中始终显示出较高的 AUC 值( 图 3I-K)。其他基因,如 IL4R、CCL20、TGFB1、BSG 和 JAK1,在至少一个队列中也表现出高于 0.7 的 AUC,表明它们作为上下文特异性诊断标志物的潜力。
3.6. 单细胞转录组学数据集和计算机敲除中机器学习模型的系统验证
将复合特征应用于 PBMC scRNA-seq 数据表明,CD14 +经典单核细胞表现出最高的中位特征评分,在包括 CD14 +单核细胞和 cDC2 在内的骨髓群体中广泛观察到升高的评分( 图 4A-C)。相比之下,大多数幼稚淋巴亚群得分较低,而活化/记忆 T 细胞亚群和 NK 细胞分布中等。在单基因水平上,关键的炎症警报素 S100A9 在高评分 CD14 +单核细胞中显示出显着富集( 图 4D),加强了其对全身先天炎症的贡献。此外,JAK1 在多个 T 谱系和 NK 细胞中表现出强大的表达,在特征和临床可作的 JAK 通路之间架起了一座机制桥梁。总的来说,这些结果表明,皮肤来源的特征在循环的先天免疫细胞中重现,部分在活化的细胞毒性/效应淋巴细胞中重现,支持其全身适用性。
图 4.模型特征的单细胞转录组学验证和计算机功能扰动分析。(A-B)银屑病患者的 PBMC 单细胞 RNA-seq 数据的 UMAP 可视化,按细胞类型 (A) 和诊断模型评分 (B) 着色。(C)小提琴图比较了不同 PBMC 细胞类型的模型分数,表明了细胞类型特异性的激活模式。(D)点图显示 PBMC 中 12 个模型基因的表达水平和细胞类型分布。(E-F)银屑病皮肤组织单细胞谱的 UMAP 图,显示细胞分布 (E) 和诊断评分强度 (F)。(G) 小提琴图显示皮肤驻留免疫细胞和上皮细胞之间模型分数的变化。(H)点图说明了不同皮肤细胞类型模型基因的表达和丰度。(I-J)病变角质形成细胞中 S100A9 的计算机敲除揭示了排名靠前的差异扰动基因(I:散点图;J:前 20 个基因的条形图)。(K-L)使用 KEGG (K) 和 Reactome (L) 富集受扰动基因的功能,表明 S100A9 耗竭后免疫和代谢信号传导被破坏。
在银屑病皮肤组织中,观察到角质形成细胞的评分升高。巨噬细胞/单核细胞的评分也略有增加,这与 PBMC 的结果一致( 图 4E-G)。对于特征基因,S100A9 在角质形成细胞中高表达( 图 4H)。为了进一步评估作者模型中关键成分的生物学效应,作者对银屑病角质形成细胞中的 S100A9、T 细胞中的 JAK1 和先天淋巴细胞中的 IL4R 等前 3 个特征基因进行了计算机敲除实验。富集高置信度差异调控基因(FDR < 0.05, 图 4I-J)用于表皮分化和角化包膜成分(例如,KRT1、KRT10、KRTDAP、DMKN、CALML3/5、C10orf99、S100A7/A7A)、结构和连接/ECM 相关基因(DST、CAV1)、抗菌/应激反应基因以及细胞周期或转录更新的调节因子(例如,ZFP36L2、CCND1)。反应组富集突出了角化、角化包膜的形成、I 型半半粒体组装、抗菌肽和多种线粒体/呼吸电子传递途径( 图 4K)。KEGG 分析证实了 IL-17 信号传导、氧化磷酸化、ECM-受体相互作用、粘连斑和产热的富集( 图 4L)。 表皮角化过度和角化不全重塑、先天 IL-17 轴和代谢/线粒体重编程的融合支持了一种模型,其中 S100A9 充当将炎症应激与银屑病角质形成细胞的分化和生物能量适应相结合的纽带。
3.7. S100A9 在银屑病模型中的体外和体内验证
为了确认数学方法确定的关键特征确实参与了银屑病的发病机制,作者进行了体外实验来验证 IL-17 对 S100A9 的影响。首先,作者用 20 ng/mL IL-17 细胞因子处理人角质形成细胞 HaCaT 细胞系,并检测 S100A9 的表达。结果表明,IL-17 处理显著上调了 S100A9 的 mRNA 和蛋白水平[ 图 5A、B 和 C]。为了在体内验证这些结果,作者进行了 IMQ 诱导的小鼠银屑病样皮炎模型( 图 5D)。作者观察到 IMQ 诱导的皮肤病变表现出明显的银屑病样病理变化,并且 S100A9 在病变表皮层中的表达显着升高( 图 5 E,5F )。作者的结果表明,S100A9 在银屑病中显著上调,可能作为其发病机制的潜在危险因素,从而进一步验证了作者机器学习模型的可靠性。
图 5.对最重要特征进行体内和体外验证。(A)用 IL-17(20ng / mL)刺激的 HaCaT 细胞中 S100A9 mRNA 表达的定量时间。(B)用 IL-17 处理的 HaCaT 细胞中 S100A9 表达的蛋白质印迹图像,指定时间。(C)用 IL-17(20ng / mL)刺激的 HaCaT 细胞中 S100A9 蛋白表达的定量,持续指定时间。(D)对照组和 IMQ 诱导组(n = 4)的动物实验示意图。(E)背部皮肤组织中 S100A9 阳性细胞的代表性免疫组织化学图像。(F)给出了每个区域表皮层中 S100A9 阳性细胞的定量(n = 4)。* 0.01 < p < 0.05;** 0.001 < p < 0.01;0.0001 < p < 0.001;第 <0.0001 页。
3.8. 分子对接揭示了污染物-蛋白质相互作用
为进一步探究大气污染物的潜在免疫毒性机制,对 7 种结构明确污染物与 12 个银屑病相关靶点进行分子对接。整体对接能矩阵如图 6A 所示,其中较低的结合能表示更强的结合亲和力。在污染物-靶标对中,甲苯始终表现出较强的结合活性,对多个靶标(包括 AHR、JAK1 和 NOS2)的对接能低于 –5.0 kcal/mol。
图 6.银屑病相关免疫靶点的分子对接。(A)7 个结构定义的污染物和 12 个银屑病相关免疫靶点之间的结合能(kcal / mol)热图。(B-D)甲苯与 AHR-甲苯络合物的对接模型;JAK1-甲苯络合物和 NOS2-甲苯络合物。
详细可视化了结合能< –5.0 kcal/mol 的 3 个代表性对接模型。甲苯与 AHR 形成多种疏水和π堆叠相互作用,特别是涉及残基 PHE295、LEU315 和 LEU353( 图 6B)。在 JAK1-甲苯配合物中,相互作用位点包括 ALA79、PRO91 和 PHE111( 图 6C),而 NOS2-甲苯配合物与 PHE1128 表现出关键的平行π堆叠相互作用( 图 6D)。

总结

总之,本研究系统地整合了多个独立数据集中的污染物-蛋白质相互作用、通路富集和转录组学验证,以确定将空气污染与银屑病联系起来的潜在分子介质。通过基于机器学习的优先级排序,作者突出显示了一组具有诊断和机制相关性的强大基因特征。这些发现为未来生物标志物开发和治疗靶向的转化工作奠定了基础。然而,需要进一步的实验和流行病学研究来验证这些生物标志物在不同人群和银屑病亚型中的因果关系和临床效用。