中国人真的一生都在卷的道路上!单一公共数据库联合机器学习已经不足为奇,今天这篇文章联合 NHANES和CHARLS 双数据库+九种机器学习模型, 发文二区。换个选题,直接套思路,SCI直接手拿把掐!
无论是NHANES/CHARLS,文中的指标数据,郑老师团队都能直接帮您挖掘和分析!
偏头痛是一种全球高发的神经疾病,研究发现代谢因素 (如胰岛素抵抗IR和肥胖) 与偏头痛密切相关。
甘油三酯-葡萄糖指数(TyG)及其与肥胖指标 (如BMI、腰围、腰高比等) 的组合 (TyG-BMI、TyG-WC、TyG-WHtR) 被提出作为 IR 的替代标志物,但其在偏头痛中的作用尚未在多国人群中得到充分验证。
2025年7月3日 ,成都中医药大学学者基于 NHANES和CHARLS数据库, 联合机器学习 , 在期刊 《Lipids in Health And Disease 》 (医学 二区,IF=4.2) 发表题为: “ The value of triglyceride–glucose index–related indices in evaluating migraine: perspectives from multi–centre cross–sectional studies and machine learning models ” 的研究 论 文。
研究采用横断面设计,结合机器学习模型,旨在探究TyG相关指标 (TyG-BMI、TyG-WC、TyG-WHtR) 与偏头痛的关联,并比较它们预测风险的性能。
研究采用 跨国对比设计,数据来自于 两个大型国家代表性数据库:
美国数据 : NHANES 1999-2004年 数据,纳入6,204名≥20岁的成年人;
中国数据 : CHARLS 2011-2012年 数据,纳入9,401名≥45岁的中老年人。
【注】 两国人群年龄结构差异显著 (NHANES含年轻群体,CHARLS仅中老年), 且中国样本偏头痛病例较少 (550例 vs 美国1,245例)。
研究采用加权logistic回归分析TyG相关指标与偏头痛的关联,并进行亚组分析和阈值效应分析以探索非线性关系。此外,应用Boruta算法筛选关键变量,并构建九种机器学习模型评估TyG-BMI和TyG-WHtR的预测性能。
研究发现,在美国人群中, TyG-BMI和TyG-WHtR与偏头痛呈显著正相关 (TyG-B MI: OR=1.28;TyG-WHtR: OR=1.17)。 并且,当 TyG-BMI>206时风险骤升,而当TyG-WHtR<7.4时风险更高。
同时, 年龄也是重要的交互因素,尤其在年轻群体(<45岁)中关联更显著。
然而,在中国人群中未检测到这种相关性,推测可能与高龄样本和病例数少有关。
表1 NHANES和CHARLS中,TyG-BMI、TyG-WC和TyG-WHtR与偏头痛的关联
模型2:调 整了 性别、年龄、种族、教育水平、婚姻状况、贫困收入比 (PIR)/ 总收入、饮酒状况和吸烟状况
图2 TyG-BMI、TyG-WC和TyG-WHtR与偏头痛关联的平滑曲线拟合
(a-c)NHANES;(d-f)CHARLS
✅机器学习模型
研究基于 Boruta 算法筛选的与偏头痛相关的关键变量,根据结果,将冠心病排除在模型评估之外。
基于此,研究构建了9种机器学习模型,结果显示, XGBoost模型预测偏头痛风险的性能最优。 并且,TyG-BMI(AUC=0.929 ) 的预测能力优于TyG-WHtR( AUC= 0.926 )。
(a) DCA; (b) ROC曲线;(c)带置信区间的ROC曲线;(d) PR 曲线;(e)校准曲线
SHAP分析进一步证实TyG-BMI是仅次于年龄的重要预测因子, 贡献稳定;而TyG-WHtR贡献波动大且排名靠后。
图5 XGBoost模型对TyG-BMI的SHAP分析
(a) SHAP线形图;(b) SHAP热浪图;(c) SHAP重要性图;(d) SHAP蜜蜂图;(e) SHAP瀑布图;(f) SHAP热图散点图;(g) SHAP热力图
综上 所 述, 相对于TyG-WHtR, TyG-BMI可以为临床医生提供有关患者胰岛素敏感性的信息, 能够有效预测美国人群的偏头痛风险,尤其在年轻人群中表现突出。 这一发现为临床提供了潜在的代谢干预靶点,有助于个体化治疗策略的制定。
发表SCI难?统计方法实在学不会?时间紧任务重?
GBD/NHANES/CHARLS/孟德尔随机化/机器学习等,郑老师团队均提供统计服务,发文有难题欢迎咨询! 专业统计师 精准解决科研痛点,一站式高效服务你的发文流程!