大家好,今天跟大家分享一篇题为Compre hensive integration of diagnostic biomar ker analysis and immunecell infiltration features in sepsis via machine learning and bioin formatics techniques(通过机器学习和生物信息技术全面整合败血症的诊断生物标志物分析和免疫细胞浸润特征)最近爆火的机器学习,想必小伙伴们早有耳闻!其不但拿下去年的诺贝尔物理学奖项,在今年的发文中也是大展身手,搭载上机器学习热点提分利器,发文简直神速!还不赶快进来学习,入手该技术方法,开启发文新篇章~!
01
研究背景
脓毒症是一种由对感染的不规则免疫反应引起的严重疾病,会导致危及生命的器官功能障碍。尽管医学取得了进步,但迫切需要研究可靠的诊断标志物和精确的治疗靶点。
我们从 Gene Expression Omnibus 中筛选出 5 个基因表达数据集 (GSE69063 、 GSE236713 、 GSE28750 、 GSE65682 和 GSE137340 )。首先,我们合并了前两个数据集。然后我们鉴定了差异表达基因 (DEGs),对其进行了 KEGG 和 GO 富集分析。在此之后,我们将 DEGs 与通过加权基因共表达网络分析 (WGCNA) 确定的关键模块的基因整合,鉴定了 262 个重叠基因。
随后使用三种机器学习算法选择了 12 个核心基因:随机森林 (RF)、最小绝对收缩和选择运算符 (LASSO) 和支持向量机递归特征消除 (SVW-RFE)。将受试者工作特征曲线与列线图模型结合使用用于验证关键基因的鉴别力和功效。CIBERSORT 用于评估脓毒症的炎症和免疫状况。黄芪、丹参和红花是血必净的主要元素,常用于脓毒症的临床治疗。利用中医系统药理学数据库和分析平台 (TCMSP),我们鉴定了这三种草药的化学成分及其靶基因。
我们发现 CD40LG 不仅是我们鉴定的 12 个核心基因之一,也是这些草药中活性成分槲皮素、木犀草素和芹菜素的共同靶点。我们提取了这些活性成分的常见化学结构——类黄酮。通过对接分析,我们进一步验证了黄酮类化合物与 CD40LG 之间的相互作用。最后,从健康个体和脓毒症患者采集血样,无论是否使用血必净,用于提取外周血单核细胞 (PBMC)。通过 qPCR 和 WB 分析。我们观察到三组 CD40LG 表达的显著差异。在这项研究中,我们确定了脓毒症的候选枢纽基因,并构建了用于其诊断的列线图。
见图一
描述调查程序的流程图。
图一
GEO,基因表达综合;GSEA,基因集富集分析;CIBERSORT,通过估计 RNA 转录本的相对亚群进行细胞类型鉴定;DEGs,差异表达基因;GO,基因本体论;KEGG,京都基因和基因组百科全书;PPI,蛋白质-蛋白质相互作用;LASSO,最小绝对收缩和选择运算符;RF, 随机森林;SVM-RFE,支持向量机递归特征消除;ROC,受试者工作特征曲线;DCA,决策曲线分析。
见图二
DEGs 的功能和通路富集评估。
图二
(A) GSEA 评估;(B) DO 检查;(C) GO 富集评估;(D) KEGG 通路富集评价;(E) PPI 网络分析。DEGs,差异表达基因;GSEA,基因集富集分析;DO,疾病本体论;GO,基因本体论;KEGG,京都基因和基因组百科全书;PPI,蛋白质-蛋白质相互作用。
见图三

构建儿科脓毒症加权共表达网络数据集。
图三
(A) 226 个样本的聚类树状图;(二、三)评估不同软阈值的网络拓扑 (β);(D) 从平均连锁分层聚类得出的基因树状图;(E) 模块-性状相关性;(F) 黑色模块中复发的 GS 与 MM 的散点图;(G) 绿黄色模块中复发的 GS 与 MM 的散点图;(H) 粉红色模块中复发的 GS 与 MM 的散点图。GS, 基因意义;MM,模块成员。
见图四
通过综合方法识别诊断标志物。
图四
(A) 比较关键模块基因与 DEGs 的维恩图;(B) 通过 SVM-RFE 筛选生物标志物;(C、D)基于射频算法筛选生物标志物;(E) 不同的颜色表示不同的基因;(F) 采用 LASSO logistic 回归算法的诊断标志物筛选。DEGs,差异表达基因;WGCNA,加权基因共表达网络;SVM-RFE,支持向量机递归特征消除;RF, 随机森林;LASSO,最小绝对收缩和选择运算符。
见图五
诊断小儿脓毒症的关键基因。
图五
(A) 维恩图说明了三种算法识别的诊断标志物的重叠;(B) 列线图用于预测儿科脓毒症的发病率;(C) 决策曲线分析 (DCA) 图;(D-F)用于验证诊断有效性的 ROC 曲线。DCA,决策曲线分析;ROC,受试者工作特征曲线;AUC,曲线下面积。
见图六
确认关键基因。
图六
(A-C)箱线图描述了数据集中儿科脓毒症组和对照组之间关键基因GSE65682表达水平;(D-F)GSE65682 中用于诊断有效性验证的 ROC 曲线。(G) 维恩图说明了所有验证集中具有显著差异且 AUC 大于 0.7 且单基因箱线图 P 值小于 0.05 的重叠基因。
02
研究结论
综上所述,我们的研究确定了 CD3E、CD40LG、LILRA5 和 FCER2 等 12 个基因是脓毒症的潜在诊断标志物。其中,我们选择了血必净 3 个主要成分的靶基因 CD40LG 作为核心基因之一。通过生物实验,我们得出血必净治疗可能通过影响 CD40LG 改善脓毒症患者的预后,为进一步研究脓毒症免疫抑制的机制提供了新的研究方向。
好了,今天的文献解读就到这儿来,我们下期再见!如果你正在开展临床研究.需要方案设计.数据管理. 数据分析等支持.也随时可以联系我们。