6+网络毒理学+机器学习+单细胞+分子对接，实现了“筛选-验证-机制” 的逻辑闭环，更重要的是这个思路非常百搭！

导语

结果：

3.1. 差异表达基因的鉴定

通过基于阈值的筛选共识别出 4226 个 DEGs，其中包括疾病组中 2178 个上调基因和 2048 个下调基因（见图 1AB）。

3.2. 识别 TCDD 诱导败血症的潜在目标基因

数据库 ChEMBL、SwissTargetPrediction、STITCH 和 CTD 分别识别出 39、5、10 和 64 个潜在有毒靶点。在整合这些靶点并去除重复后，识别出 106 个独特的潜在毒性靶点（见图 1C）。OMIM 和 Genecards 数据库分别提供了 63 个和 1097 个败血症相关的目标基因。去除重复后，获得了 1097 个败血症相关靶基因。通过交叉 TCDD 的 106 个潜在毒性靶点与 1097 个败血症相关靶点，识别出 37 个由 TCDD 引起的败血症潜在靶基因（图 1D）。这些基因包括：RAC2、HBEGF、PARP1、HSP90AA1、CYP1A2、CYP2B6、FLT1、AKR1B1、EGF、NFE2L2、IL1B、TNF、HMOX1、SRC、EGFR、JUN、MAPK3、IL6、MAPK1、SERPINE1、UGT1A1、VEGFA、IL22、PPARG、CD36、TP53、CCL2、TGFB1、MYC、CASPASE-3、CXCL8、MMP9、NFKB1、RELA、IGFBP1、MMP1 和 IGF1（见图 1E）。

图 1。TCDD 诱导败血症的潜在目标基因。答：坐标表示 log10（p 值），横轴表示 log2FC。水平参考虚线对应 -Log10（0.05） = 1.3，而垂直参考虚线代表 log2FC= ± 0.5。B：基于差异 log2FC 的热图显示了前 10 个上调和前 10 个下调基因。红色代表败血症组，蓝色代表对照组。C：TCDD-目标网络图。D：识别与 TCDD 相关的潜在败血症目标基因。E：TCDD-靶向-疾病网络图。

3.3. 候选基因鉴定、GO 和 KEGG 通路富集分析及 PPI 网络构建

通过交叉 4226 个 DEGs 和 37 个由 TCDD 诱导的败血症潜在靶基因，鉴定出 9 个候选基因：PARP1、HSP90AA1、FLT1、AKR1B1、PPARG、TP53、MYC、CASPASE-3 和 MMP9（见图 2A）。去氧气富集分析共识别出 881 条结果，其中包括 773 个生物过程、25 个细胞组分和 83 个分子功能（见图 2BC）。KEGG 富集分析识别出 55 条 KEGG 信号通路，其中前 15 条被可视化（图 2DE）。PPI 网络分析显示 28 条边缘，平均节点度为 6.22，局部聚类系数为 0.948，富集 p 值为 0.0121（见图 2F），证实候选基因对应蛋白之间的相互作用。

图 2。候选基因分析。答：上半部分：不同基因组独有且共享的基因数量。下半节：独特和常见基因的分类。左侧部分：包含非冗余基因的数量。B：纵轴显示 GO 项。C：第一层：GO 术语 ID，分类 BP、CC 和 MF 这三个功能;第二层：颜色强度以表示显著性，长度、宽度和数字代表基因计数;第三层：被下调基因的数量。D：对 GO 浓缩结果的分析。E：同心圆代表：第一层显示 KEGG 项 ID，第二和第三层采用与 GO 富集分析相同的方法进行分析。F：PPI 网络：每个节点代表一个基因，边缘表示蛋白质间相互作用。

3.4. 候选关键生物标志物的识别

套索算法：最优正则化参数 lambda 被识别为 0.0005787241，对应的对数（最优 lambda）为−7.454685（图 3A）。在此参数下，Lasso 回归模型表现出色，保留了六个特征基因——PARP1、FLT1、AKR1B1、PPARG、CASPASE-3 和 MMP9——构成了疾病预测中最准确的特征组合（见图 3B）。

图 3。候选关键生物标志物分析。答：套索回归系数路径。B：套索交叉验证图。C：SVM-RFE 算法分析。D：Boruta 算法分析。E：候选关键生物标志物的识别。F：孟德尔森林地块。G：散点图。正斜率表示风险因素，负斜率表示安全系数。截距表明存在混杂因素。H：森林地块。0 左侧完全的实线表示暴露因子增加降低结局风险，反之亦然。交叉 0 的直线不显著。

SVM-RFE 算法：模型评估显示，当特征基因数量减少到七个时，预测准确率达到峰值（见图 3C）。这七个关键基因——TP53、MMP9、AKR1B1、PARP1、PPARG、CASPASE-3 和 MYC——构成了具有高度敏感性和特异性的疾病预测特征组合。

Boruta 算法：九个特征的重要性评分显著高于对应的阴影特征，证实它们与结果预测的高度相关性（图 3D）。

6+网络毒理学+机器学习+单细胞+分子对接，实现了“筛选-验证-机制” 的逻辑闭环，更重要的是这个思路非常百搭！

这三种算法的结果交汇，识别出五个候选关键生物标志物：PARP1、AKR1B1、PPARG、CASPASE-3 和 MMP9（见图 3E）。

3.5. 发现 PPARG 和 CASPASE-3 基因与败血症之间存在显著因果关系

鉴定出两个与败血症有显著因果关系的基因，其中 PPARG 和 CASPASE-3 被认定为败血症风险因子（OR > 1）（见图 3F）。暴露-结局相关分析（图 3G）和工具变量-结局效应估计（图 3H）进一步确认 PPARG 和 CASPASE-3 为风险因子（OR > 1）。

3.6. 生物标志物的识别

PPARG 和 CASPASE-3 的表达趋势在多个数据集中保持一致且显著不同，表明这两种候选生物标志物在疾病和对照样本间的表达更为稳定。记录了表现出显著差异和一致趋势的基因作为生物标志物：PPARG 和 CASPASE-3（见图 4ABC）。

3.7. 生物标志物富集通路

PPARG 在 64 条通路中显著富集，而 CASPASE-3 在 46 条通路中显著富集。这两个基因的显著富集通路包括 KEGG 氧化磷酸化、KEGG 帕金森病、KEGG 亨廷顿病、KEGG 阿尔茨海默病、KEGG 神经活性配体-受体相互作用、KEGG 抗原加工与呈现、KEGG 移植物抗宿主病、KEGG 异体移植物排斥反应以及 KEGG 自身免疫性甲状腺疾病（图 4DE）。

3.8. 生物标志物 PPARG 和 CASPASE-3 与γδT 细胞显著相关

按照算法的置信度评估标准，所有样本均保留有效免疫细胞内容数据，且因置信度不足未排除任何样本（见图 4F）。经过严格的统计检测，识别出 11 种具有显著差异的免疫细胞类型：B 细胞记忆、B 细胞初生细胞、M0 巨噬细胞、M2 巨噬细胞、单核细胞、静息 NK 细胞、中性粒细胞、浆细胞、静息 CD4 记忆 T 细胞、CD8+T 细胞和γδ T 细胞（见图 4G）。相关矩阵显示了相关系数和显著水平，显示了生物标志物 PPARG 和 CASPASE-3 与γδ T 细胞之间存在显著相关性（p < 0.05 & |cor| > 0.3）（图 4H）。

图 4。生物标志物：PPARG 和 CASPASE-3。答：GSE95233。B：GSE57065。C：GSE28750。在小提琴图中，**** 表示 p < 0.0001，*** 表示 p < 0.001，** 表示 p < 0.01，* 表示 p < 0.05，ns 表示 p > 0.05。D/E：第一部分：前五条路径的基因丰富评分折线图;第二部分：单个基因对应条形码状的垂直线;第三部分：所有基因的排名值分布。F：免疫细胞浸润堆积图。G：分化免疫细胞的小提琴图。H：生物标志物与免疫浸润细胞的相关性。

3.9. PPARG 和 CASPASE-3 对 TCDD 的亲和力良好

PPARG 与 CASPASE-3 及 TCDD 之间的结合能较强（< −1.2 kcal/mol），表明结合亲和力较高（见图 5）。

图 5。生物标志物-TCDD 分子对接图。3.10. 单细胞分析结果3.10.1. 关键细胞的识别

两组在树突状细胞和中性粒细胞比例上观察到显著差异（图 6A）。研究了所有细胞类型中 PPARG 和 CASPASE-3 的表达（图 6B），显示中性粒细胞和单核细胞表达差异显著（图 6C）。值得注意的是，中性粒细胞作为差异化的细胞类型和生物标志物表达细胞，可能在败血症病理中发挥关键作用。其生物标志物的差异表达可能与败血症的发病机制、进展或治疗反应密切相关。

图 6。中性粒细胞分析。答：差异细胞鉴定的箱形图。B：UMAP 图。C：所有败血症和对照细胞组的生物标志物表达。D：准时间轨迹图。E：分化轨迹的阶段。F：不同单元子集的轨迹图。G：基因表达动态热图。

3.10.2. 中性粒细胞的准时间分析

生成了直观的发展轨迹图。中性粒细胞分化为五个不同的状态，代表细胞分化的不同阶段（图 6DEF）。当细胞从一种状态转变到另一种状态时，生物标志物的表达会发生显著变化，进一步证实了细胞分化的动态性和复杂性（见图 6G）。

总结

总之，本研究确定了两个对败血症进展至关重要的关键生物标志物：PPARG 和 CASPASE-3。KEGG 富集分析揭示了其参与氧化磷酸化、帕金森病、亨廷顿舞蹈症、阿尔茨海默病以及神经活性配体-受体相互作用等通路，突出了败血症进展过程中γδT 细胞和中性粒细胞（标记基因：CD177、MMP9、LCN2）的变化。这些发现表明环境污染物 TCDD 可能促成败血症进展，并为制定有效的预防和干预策略提供科学基础，以更好地保护人类健康，特别是针对因长期 TCDD 暴露而处于高风险人群。然而，这些发现并未得到直接蛋白质水平数据或功能验证实验的支持。

！

微精选

6+网络毒理学+机器学习+单细胞+分子对接，实现了“筛选-验证-机制” 的逻辑闭环，更重要的是这个思路非常百搭！

最近文章