源自风暴统计网:一键统计分析与绘图的AI网站

  引言

突破传统 “单一时间点抑郁评分” 分析框架,北大学者用CHARLS公共数据系统分层分析不同抑郁轨迹下 MCDs 的危险因素。复现不难,快来简单看下吧!
ps:郑老师团队开发的CHARLS整理分析平台已上线,复杂动态队列数据一键提取和分析,欢迎联系我们试用!
抑郁症状与多种慢性病(MCDs)是全球中老年人群疾病负担的重要构成因素,然而既往研究多聚焦于某一时间点的抑郁症状,而忽视了其长期动态变化特征。

2025年10月10,北京大学者用CHARLS数据库,期刊Journal of Affective Disorders(医学二区Top,IF=4.9)发表了一篇题为:“The similarities and differences of multiple chronic diseases risk factors across depressive symptoms trajectories among middle-aged and older Chinese adults: A 10-year longitudinal cohort study究论文旨在基于中国45岁及以上人群的抑郁症状轨迹,识别其罹患多重慢性疾病(MCDs)的共性及特异性风险因素。

研究结果表明,腰围、自评健康、睡眠时间、抑郁症状评分、年龄是不同轨迹下MCDs的共性危险因素,而 BMI、握力、午睡时长为轨迹特异性危险因素。


本公众号回复“ 原文”即可获得文献PDF等资料,如需CHARLS数据库方法学习请联系郑老师团队,微信号:aq566665

研究基于中国健康与退休纵向研究(CHARLS)数据2011-2020年的数据经过筛选,最终纳入2552名基线无慢性病、完成全部随访、年龄≥45岁的参与者。
研究思路如下:
首先,使用潜类别增长模型(LCGM)与增长混合模型(GMM)识别抑郁症状的长期轨迹;
随后,基于不同轨迹分组,采用七种机器学习算法构建MCDs预测模型,并通过递归特征消除与SHAP方法进行特征选择与模型解释;
最后,开发在线预测工具,实现个体化风险评估,并通过敏感性分析验证结果的稳健性。

图1 研究的总体流程图

主要研究结果

研究共识别出四种抑郁症状轨迹:稳定低症状(75.12%)、持续高症状(6.62%)、新发加重症状(12.15%)与缓解症状(6.11%)。

图2 2011年至2020年抑郁症状的异质性长期轨迹

结果显示,在 7 种机器学习模型中,随机森林、XGBoost与GBDT模型分别为 “持续高症状”“新发加重症状”“缓解症状” 轨迹的最优 MCDs 预测模型,其AUC-ROC分别为0.834、0.838与0.805。

北大郭静团队仅4天发表!CHARLS共病研究这波操作我给满分

图3 七种机器学习模型在不同轨迹的AUC-ROC曲线、准确率和Brier评分对比

SHAP分析进一步明确,所有轨迹的共同重要风险因素包括腰围、自评健康、睡眠时长、抑郁评分与年龄;而轨迹特异性因素包括BMI(持续高症状)、握力(新发加重症状)与午睡时长(缓解症状)。

同时,SHAP图进一步揭示了各因素对预测结果的贡献方向与强度。

图4 SHAP分析结果

持续高症状与稳定低症状(A);新发加重症状与稳定低症状(B);缓解症状与稳定低症状(C);

综上所述,揭示了抑郁症状轨迹的异质性及其与MCDs风险的动态关联,通过机器学习模型识别出共性与轨迹特异性风险因素。研究建议临床实践中结合个体抑郁症状轨迹特征,重点关注腰围、自评健康等共同因素及轨迹特异性指标,以实现更有效的健康管理。

CHARLS整理分析平台

还在为 CHARLS队列数据分析头疼吗?

郑老师团队开发的CHARLS整理分析平台,不仅海量指标一键提取和分析,最重要的是,复杂的动态队列数据不用您费心研究了!难题都交给我们,发刊效率拉满。

欢迎免费试用:

https://zs./charls_encryption/CHALRS_data/charls_data_1.3_trial/


记得点个小小的关注👇

持续分享CHARLS数据库的高分发文思路