-
传统的基于回归的Cox比例风险(CPH)模型具有统计假设,预测精度有限。 -
机器学习(ML)由于能够对大型数据集进行建模,有可能改善对时间到事件结果的预测,例如癌症生存结果。
研究系统地检索了PubMed、MEDLINE(通过EBSCO)和Embase,以评估ML模型与CPH模型对癌症生存结果的影响。总结了ML算法的使用,并描述性地给出了ML和CPH模型的曲线下面积(AUC)或一致性指数(C-index)。
最终的荟萃分析中只纳入了提供区分度的研究,即AUC或C-index和95%置信区间(CI)。
-
用森林图来展示基于机器学习的模型和 CPH 模型的 AUC 或 C-index 的汇总值及其 95%CI 预测区间。
-
采用随机效应模型比较ML算法和CPH模型的总AUC或C-index值及其95% CI。
-
使用 Cochran 的 Q 检验、τ 2 统计量和 Higgins I 2 统计量评估这些研究的异质性(例如,设置、研究人群和方法的差异)。
另外使用可用的清单评估研究的质量,进行多重敏感性分析。
机器学习算法使用情况
共有 21 篇研究被纳入本次系统评价,7项用于荟萃分析。
最常用的机器学习算法是随机生存森林(RSF)(N = 16,76.19%),梯度提升(GB)(N = 5,23.81%),神经网络(NN)(N = 8,38.09%)。
在这些研究中,只有少数研究应用了外部验证方法(N = 6,28.57%)。
总体而言,在21项研究中评估了42个ML模型,平均AUC或C-指数为0.759,中位数AUC或C-指数为0.751(四分位间距(IQR): 0.121;范围: 0.337)。这些研究中有很大一部分(N = 17, 80.95%)的ML模型AUC等于0.7或更高。
ML算法的平均(标准差)[中位数]AUC或C-index分别为:
-
RSF:0.766(0.085)[0.753]

-
GB:0.760(0.056)[0.757]
-
NN:0.770(0.097)[0.754]
-
支持向量机SVM:0.732(0.088)[0.684]
-
其他ML算法:0.746(0.072)[0.723]
CPH模型和ML算法具有相似的预测准确性
在所有文献中,只有7篇报道了ML和CPH方法预测总生存期的AUC或C-指数和95% CI的文献被纳入meta分析。
相对于CPH模型,对这7个ML模型的性能进行了评估。Meta分析显示,预测癌症生存结果方面,ML模型没有表现出比CPH回归更好的性能。AUC或c指数的标准化均值差(SMD)为0.01 (95% CI: -0.01至0.03),突出了两种方法在性能上的相似性。
敏感性分析的结果证实了主要发现的稳健性。
基于改良的Luo检查表和TRIPOD声明,几乎所有研究(95.24%)均为高质量、低偏倚风险的研究。
综上所述,研究者发现RSF是最常用的ML模型,反映了它作为生存分析的ML算法的偏好。正在研究的用于生存分析的ML算法具有良好的预测能力,中位AUC或C-index为0.751。具体而言,其中17项研究的ML模型auc或C-index值为0.7或更高。
然而,荟萃分析显示,这些ML模型并不优于传统的基于回归的CPH模型。
所以说,老郑还是那句话,在预测性能没有显著提升的情况下,郑老师认为,传统回归的透明度和简单性通常是更负责任和更实用的选择。
参考文献:Huang, Y., Bazzazzadehgan, S., Li, J. et al. Comparison of machine learning methods versus traditional Cox regression for survival prediction in cancer using real-world data: a systematic literature review and meta-analysis. BMC Med Res Methodol 25, 243 (2025). https:///10.1186/s12874-025-02694-z