导语

结果:

3.1. 差异表达基因的鉴定

通过基于阈值的筛选共识别出 4226 个 DEGs,其中包括疾病组中 2178 个上调基因和 2048 个下调基因(见图 1AB)。

3.2. 识别 TCDD 诱导败血症的潜在目标基因
数据库 ChEMBL、SwissTargetPrediction、STITCH 和 CTD 分别识别出 39、5、10 和 64 个潜在有毒靶点。在整合这些靶点并去除重复后,识别出 106 个独特的潜在毒性靶点( 见图 1C)。OMIM 和 Genecards 数据库分别提供了 63 个和 1097 个败血症相关的目标基因。去除重复后,获得了 1097 个败血症相关靶基因。通过交叉 TCDD 的 106 个潜在毒性靶点与 1097 个败血症相关靶点,识别出 37 个由 TCDD 引起的败血症潜在靶基因( 图 1D)。这些基因包括:RAC2、HBEGF、PARP1、HSP90AA1、CYP1A2、CYP2B6、FLT1、AKR1B1、EGF、NFE2L2、IL1B、TNF、HMOX1、SRC、EGFR、JUN、MAPK3、IL6、MAPK1、SERPINE1、UGT1A1、VEGFA、IL22、PPARG、CD36、TP53、CCL2、TGFB1、MYC、CASPASE-3、CXCL8、MMP9、NFKB1、RELA、IGFBP1、MMP1 和 IGF1( 见图 1E)。

图 1。TCDD 诱导败血症的潜在目标基因。答:坐标表示 log10(p 值),横轴表示 log2FC。水平参考虚线对应 -Log10(0.05) = 1.3,而垂直参考虚线代表 log2FC= ± 0.5。B:基于差异 log2FC 的热图显示了前 10 个上调和前 10 个下调基因。红色代表败血症组,蓝色代表对照组。C:TCDD-目标网络图。D:识别与 TCDD 相关的潜在败血症目标基因。E:TCDD-靶向-疾病网络图。

3.3. 候选基因鉴定、GO 和 KEGG 通路富集分析及 PPI 网络构建
通过交叉 4226 个 DEGs 和 37 个由 TCDD 诱导的败血症潜在靶基因,鉴定出 9 个候选基因:PARP1、HSP90AA1、FLT1、AKR1B1、PPARG、TP53、MYC、CASPASE-3 和 MMP9( 见图 2A)。去氧气富集分析共识别出 881 条结果,其中包括 773 个生物过程、25 个细胞组分和 83 个分子功能(见图 2BC)。KEGG 富集分析识别出 55 条 KEGG 信号通路,其中前 15 条被可视化(图 2DE)。PPI 网络分析显示 28 条边缘,平均节点度为 6.22,局部聚类系数为 0.948,富集 p 值为 0.0121( 见图 2F),证实候选基因对应蛋白之间的相互作用。

图 2。候选基因分析。答:上半部分:不同基因组独有且共享的基因数量。下半节:独特和常见基因的分类。左侧部分:包含非冗余基因的数量。B:纵轴显示 GO 项。C:第一层:GO 术语 ID,分类 BP、CC 和 MF 这三个功能;第二层:颜色强度以表示显著性,长度、宽度和数字代表基因计数;第三层:被下调基因的数量。D:对 GO 浓缩结果的分析。E:同心圆代表:第一层显示 KEGG 项 ID,第二和第三层采用与 GO 富集分析相同的方法进行分析。F:PPI 网络:每个节点代表一个基因,边缘表示蛋白质间相互作用。

3.4. 候选关键生物标志物的识别
套索算法:最优正则化参数 lambda 被识别为 0.0005787241,对应的对数(最优 lambda)为−7.454685( 图 3A)。在此参数下,Lasso 回归模型表现出色,保留了六个特征基因——PARP1、FLT1、AKR1B1、PPARG、CASPASE-3 和 MMP9——构成了疾病预测中最准确的特征组合( 见图 3B)。
图 3。候选关键生物标志物分析。答:套索回归系数路径。B:套索交叉验证图。C:SVM-RFE 算法分析。D:Boruta 算法分析。E:候选关键生物标志物的识别。F:孟德尔森林地块。G:散点图。正斜率表示风险因素,负斜率表示安全系数。截距表明存在混杂因素。H:森林地块。0 左侧完全的实线表示暴露因子增加降低结局风险,反之亦然。交叉 0 的直线不显著。

SVM-RFE 算法:模型评估显示,当特征基因数量减少到七个时,预测准确率达到峰值( 见图 3C)。这七个关键基因——TP53、MMP9、AKR1B1、PARP1、PPARG、CASPASE-3 和 MYC——构成了具有高度敏感性和特异性的疾病预测特征组合。

Boruta 算法:九个特征的重要性评分显著高于对应的阴影特征,证实它们与结果预测的高度相关性( 图 3D)。

6+网络毒理学+机器学习+单细胞+分子对接,实现了“筛选-验证-机制” 的逻辑闭环,更重要的是这个思路非常百搭!
这三种算法的结果交汇,识别出五个候选关键生物标志物:PARP1、AKR1B1、PPARG、CASPASE-3 和 MMP9( 见图 3E)。

3.5. 发现 PPARG 和 CASPASE-3 基因与败血症之间存在显著因果关系
鉴定出两个与败血症有显著因果关系的基因,其中 PPARG 和 CASPASE-3 被认定为败血症风险因子(OR > 1)( 见图 3F)。暴露-结局相关分析( 图 3G)和工具变量-结局效应估计( 图 3H)进一步确认 PPARG 和 CASPASE-3 为风险因子(OR > 1)。

3.6. 生物标志物的识别
PPARG 和 CASPASE-3 的表达趋势在多个数据集中保持一致且显著不同,表明这两种候选生物标志物在疾病和对照样本间的表达更为稳定。记录了表现出显著差异和一致趋势的基因作为生物标志物:PPARG 和 CASPASE-3(见图 4ABC)。

3.7. 生物标志物富集通路
PPARG 在 64 条通路中显著富集,而 CASPASE-3 在 46 条通路中显著富集。这两个基因的显著富集通路包括 KEGG 氧化磷酸化、KEGG 帕金森病、KEGG 亨廷顿病、KEGG 阿尔茨海默病、KEGG 神经活性配体-受体相互作用、KEGG 抗原加工与呈现、KEGG 移植物抗宿主病、KEGG 异体移植物排斥反应以及 KEGG 自身免疫性甲状腺疾病(图 4DE)。

3.8. 生物标志物 PPARG 和 CASPASE-3 与γδT 细胞显著相关
按照算法的置信度评估标准,所有样本均保留有效免疫细胞内容数据,且因置信度不足未排除任何样本( 见图 4F)。经过严格的统计检测,识别出 11 种具有显著差异的免疫细胞类型:B 细胞记忆、B 细胞初生细胞、M0 巨噬细胞、M2 巨噬细胞、单核细胞、静息 NK 细胞、中性粒细胞、浆细胞、静息 CD4 记忆 T 细胞、CD8+T 细胞和γδ T 细胞( 见图 4G)。相关矩阵显示了相关系数和显著水平,显示了生物标志物 PPARG 和 CASPASE-3 与γδ T 细胞之间存在显著相关性(p < 0.05 & |cor| > 0.3)( 图 4H)。

图 4。生物标志物:PPARG 和 CASPASE-3。答:GSE95233。B:GSE57065。C:GSE28750。在小提琴图中,**** 表示 p < 0.0001,*** 表示 p < 0.001,** 表示 p < 0.01,* 表示 p < 0.05,ns 表示 p > 0.05。D/E:第一部分:前五条路径的基因丰富评分折线图;第二部分:单个基因对应条形码状的垂直线;第三部分:所有基因的排名值分布。F:免疫细胞浸润堆积图。G:分化免疫细胞的小提琴图。H:生物标志物与免疫浸润细胞的相关性。

3.9. PPARG 和 CASPASE-3 对 TCDD 的亲和力良好
PPARG 与 CASPASE-3 及 TCDD 之间的结合能较强(< −1.2 kcal/mol),表明结合亲和力较高( 见图 5)。

图 5。生物标志物-TCDD 分子对接图。3.10. 单细胞分析结果3.10.1. 关键细胞的识别
两组在树突状细胞和中性粒细胞比例上观察到显著差异( 图 6A)。研究了所有细胞类型中 PPARG 和 CASPASE-3 的表达( 图 6B),显示中性粒细胞和单核细胞表达差异显著( 图 6C)。值得注意的是,中性粒细胞作为差异化的细胞类型和生物标志物表达细胞,可能在败血症病理中发挥关键作用。其生物标志物的差异表达可能与败血症的发病机制、进展或治疗反应密切相关。

图 6。中性粒细胞分析。答:差异细胞鉴定的箱形图。B:UMAP 图。C:所有败血症和对照细胞组的生物标志物表达。D:准时间轨迹图。E:分化轨迹的阶段。F:不同单元子集的轨迹图。G:基因表达动态热图。

3.10.2. 中性粒细胞的准时间分析
生成了直观的发展轨迹图。中性粒细胞分化为五个不同的状态,代表细胞分化的不同阶段(图 6DEF)。当细胞从一种状态转变到另一种状态时,生物标志物的表达会发生显著变化,进一步证实了细胞分化的动态性和复杂性( 见图 6G)。

总结

 总之,本研究确定了两个对败血症进展至关重要的关键生物标志物:PPARG 和 CASPASE-3。KEGG 富集分析揭示了其参与氧化磷酸化、帕金森病、亨廷顿舞蹈症、阿尔茨海默病以及神经活性配体-受体相互作用等通路,突出了败血症进展过程中γδT 细胞和中性粒细胞(标记基因:CD177、MMP9、LCN2)的变化。这些发现表明环境污染物 TCDD 可能促成败血症进展,并为制定有效的预防和干预策略提供科学基础,以更好地保护人类健康,特别是针对因长期 TCDD 暴露而处于高风险人群。然而,这些发现并未得到直接蛋白质水平数据或功能验证实验的支持