衰弱是老年人群健康不良结局的重要预测因素,但由于现有工具的复杂性和耗时性,对其进行常规评估仍然具有挑战性。
尤其是在慢性肾脏病(CKD)等复杂疾病人群中,亟需一种既能保持预测准确性又便于临床实施的简化评估工具。
2025年8月15日,中山大学附属第三医院学者基于NHANES+CHARLS+CHNS+中山大学附属第三医院CKD队列数据,在期刊《Journal of Translational Medicine》(医学二区Top,IF=7.5)发表了一篇题为:“Development and multi-cohort validation of a machine learning-based simplified frailty assessment tool for clinical risk prediction”的研究论文。
本研究旨在利用机器学习方法,从多队列数据中筛选关键变量,构建一个简化且高效的衰弱评估工具,用于预测衰弱状态及其相关临床结局(如CKD进展、心血管事件和全因死亡率),以提升其在真实临床场景中的适用性和可推广性。
本公众号回复“ 原文”即可获得文献PDF等资料。想用NHANES发文,看看这个包含上百种NHANES指标数据的零代码分析平台!如感兴趣,请添加微信号:aq566665
数据来源
-
美国国家健康与营养调查(NHANES, n=3,480)1999-2002年数据作为训练与内部验证集; -
中国健康与养老追踪调查(CHARLS, n=16,792)2011年基线数据和中国健康与营养调查(CHNS, n=6,035)2009年基线数据,用于外部验证与心血管结局预测; 队列(SYSU3 CKD, n = 2,264)2011-2019年数据用于CKD进展与临床验证。
具体的研究思路
首先,从NHANES数据中初选75个潜在预测变量,通过五种特征选择算法(LASSO、VSURF、Boruta、varSelRF、RFE)进行筛选,确定核心变量集;

随后,比较12种机器学习算法在训练集(NHANES)、内部验证集(NHANES子集)和外部验证集(CHARLS、CHNS、SYSU3 CKD)上的性能;
最终,选择最优模型并进行临床验证与可解释性分析。
主要研究结果
图3 机器学习衰弱模型在预测不同队列的多种健康结果中的临床效用
(A) SYSU3 CKD队列的CKD进展预测;(B)与传统衰弱指数预测CHARLS患者肾功能快速下降的比较;(C) CHNS患者心血管事件预测;(D)与传统衰弱指数比较CHARLS的心血管结局;(E)与传统衰弱指标相比,NHANES中随时间变化的死亡率预测;(F) Kaplan-Meier生存曲线按预测的衰弱风险类别分层
图4 特征变量的SHAP值及其对预测结果的影响
“NHANES · CHARLS 双库”
发表无忧训练营
如果你觉得单一数据库无法满足你的需求,想冲刺更高级别的SCI文章?
郑老师团队的“NHANES · CHARLS 双库” 发表无忧训练营为您量身打造,个性化为您设计专属选题思路,手把手带您发表高质量文章!
我们将为您分享更多公共数据库的高分发文思路和统计小技巧!