主要研究指标
生物学衰老:利用 R 语言包 “BioAge” 根据 8 项生物标志物计算生物学年龄和表型年龄,表型年龄则基于 9 项变量推算而得。
CKM 综合征:CKM 综合征定义为同时存在亚临床或临床心血管疾病(CVD)、慢性肾脏疾病(CKD)和代谢紊乱。通过20余项变量计算而来。并按 CKM 综合征严重程度分为两组:非晚期组(第 0–2 期)和晚期组(第 3–4 期)。
结局指标:包括全因死亡、CVD 死亡和非 CVD 死亡。
目前,NHANES公共数据库的挖掘分析中,基本都要综合指标了,如上述的DII、CKM综合征等,计算相对比较复杂。
如DII,先要找到文献依据,再挖掘27项成分,再对计算方法逻辑梳理,编写代码,计算得到DII指标。
为节省时间,也能保证计算的准确性,不妨使用郑老师团队基于R语言开发的NHANES在线下载和分析平台,这些综合指标已经计算好,可以直接分析,感兴趣的指标也可以和我们说,快马加鞭为您安排!欢迎联系:微信号aq566665获取试用链接。
首先,较高的 DII 水平与更高的生物学年龄和表型年龄显著相关。加速衰老(表型及生物学年龄)均与晚期 CKM 分期及全因死亡显著相关。

中介分析显示:
-
生物学年龄在 DII 对晚期 CKM 分期影响中,中介效应占 23%,在 DII 对全因死亡的影响中占 13%;
-
表型年龄的中介比例分别为 36% 和 23%。
4.构建八种机器学习模型,对 CKM 分期(第 3/4 期)进行分类及预测全因死亡,结合SHAP方法解析各 DII 组成成分的相对贡献。
-
在验证集中评估晚期 CKM 分期预测模型的 ROC 曲线显示,LightGBM 模型 AUC 最高,为 0.896;其次为 LR 和 XGBoost,均为 0.895。
-
对于全因死亡预测,LR、LightGBM、XGBoost 性能最优,AUC 分别为 0.857、0.848和 0.843;且 LightGBM、LR、XGBoost 在准确率和 F1 分数上也优于其它模型。
基于验证集的加权集成 SHAP 值排序结果显示:
-
预测晚期 CKM 分期的主要贡献者排序如下。
-
预测全因死亡的主要贡献者排序如下。