|
在作者的研究中,214 名患者中有 94 例达到了病理完全缓解(pCR),占 43.9%(94/214),其中训练集有 66 例,测试集有 28 例。120 名患者未达到病理完全缓解,占 56.1%(120/214),其中训练集有 83 例,测试集有 37 例。训练集和测试集中的乳腺癌临床-影像学基线特征显示在 Table 1。训练集和测试集的临床-影像学特征无显著差异(p>0.05)。
对训练集中的数据进行了单因素逻辑回归分析,非 pCR 组和 pCR 组在 ER、PR、HER-2、Ki-67、分子亚型、NAC 方案、肿瘤大小、形状、病灶类型和 BES 方面存在统计学显著差异(p<0.05)。多因素逻辑回归分析显示,ER(95%置信区间[CI]:0.003-0.804; P=0.035)、Ki-67(95%CI: 1.011-1.059; P=0.004)和 BES(P=0.043)是 pCR 状态的独立风险因素,如图Table 2和 Supplementary Figure S1所示。这三个独立预测因子被用于构建 CM。
在这项研究中,作者比较了基于四个不同肿瘤周围区域(2 毫米、4 毫米、6 毫米和 8 毫米)的影像组学特征的 pCR 状态的预测性能( Supplementary Table S2)。结果表明,6 毫米 PRM 在训练集和测试集中均具有最高的最大 AUC(0.794 和 0.779)。因此,作者选择 6 毫米作为预测 pCR 状态的最佳肿瘤周围区域,用于后续研究。
从每位患者的肿瘤内区域、6 毫米肿瘤周围区域和肿瘤内+6 毫米肿瘤周围区域分别提取了 1781、1781 和 3562 个影像组学特征。保留了 ICC 值大于 0.75 的特征,并通过筛选阈值百分比和 f_classif 函数降低特征维度。最终,经过 LASSO 回归,分别获得了与 pCR 状态高度相关的 10、11 和 10 个最优影像组学特征。构建了 IRM、6 毫米 PRM 和 CIPRM,并计算了 Rad-Score。Supplementary Table S3图展示了三个影像组学模型的影像组学特征及其相应系数。在三个影像组学模型中,CIPRM 在训练集和测试集中的 AUC 分别为 0.851 和 0.840,其预测性能优于 IRM 和 6 毫米 PRM( Supplementary Table S2)。根据混淆矩阵结果,CIPRM 在训练集中的灵敏度、特异性和准确率分别为 0.788、0.771 和 0.779,在测试集中的灵敏度、特异性和准确率分别为 0.750、0.757 和 0.754( Supplementary Figure S2)。CIPRM 的 Rad-Score 如下:
Rad-Score=+2.339×小波-LHH_gldm_LargeDependenceLowGrayLevelEmphasis+ 2.184×指数_一阶_Kurtosis+1.763×梯度_glszm_SmallAreaLowGrayLevelEmphasis+1.751×小波-HLL_glcm_ClusterTendency-1.520×小波-HHL_glcm_Idmn-1.439×小波-LHH_一阶_Kurtosis+1.205×小波-HHH_glcm_MCC+1.112×小波-HLH_gldm_LargeDependenceHighGrayLevelEmphasis+0.702×对数_glcm_Imc2-0.631×小波-LLH_ngtdm_Busyness-1.834
不同机器学习算法预测性能的比较显示在Supplementary Table S2。在 CIPRM 中,训练集中五种机器学习算法的 AUC 值介于 0.755 至 0.851 之间,测试集中的 AUC 值介于 0.704 至 0.840 之间。与其他机器学习算法相比,SVM 在训练集(0.851)和测试集(0.840)中均获得最大的 AUC 值,且这两个数据集的 AUC 值差异较小,表明 SVM 具有最佳且最稳定的性能。
CIPRM Rad-score 结合临床影像学因素(ER、Ki-67 和 BES)被用于构建一个列线图。列线图显示 CIPRM Rad-score 在模型构建中权重最大,其次是 Ki-67(Figure 4)。作者最终构建了五个预测病理完全缓解状态的模型,包括 IRM、6 毫米 PRM、CIPRM、CM 和 NM。 Figure 5展示了这些五个模型在训练集和测试集中的 ROC 曲线。ROC 曲线显示,训练集和测试集中 NM 的 AUC 分别为 0.911 和 0.897,高于 IRM 的 0.795 和 0.776、6 毫米 PRM 的 0.794 和 0.779、CIPRM 的 0.851 和 0.840,以及 CM 的 0.764 和 0.778( Figure 5; Table 3)。
该列线图是基于 ER、Ki-67、BES 和 CIPRM Rad-score 开发的。
训练集和测试集中五个模型的 ROC 曲线(A) 和 (B)。IRM,肿瘤内放射组学模型;PRM,6 毫米肿瘤周围放射组学模型;CIPRM,结合肿瘤内和 6 毫米肿瘤周围放射组学模型;CM,临床放射学模型;NM,列线图模型。
DeLong 检验显示,在训练集中 NM 与其他四个模型之间存在统计学显著差异(p<0.05),且NM具有更好的预测性能(Table 4)。10折交叉验证表明NM表现出优异的稳定性( Supplementary Figure S3)。校准曲线显示NM预测的pCR状态曲线趋势与实际曲线基本一致( Figure 6)。DCA显示NM在预测乳腺癌患者新辅助化疗后pCR状态方面具有最大的临床净获益( Figure 7)。
列线图模型在训练集(A) 和测试集 (B) 中的校准曲线。
训练集和测试集中五个模型的决策曲线(A) 和 (B)。IRM,肿瘤内放射组学模型;PRM,6 毫米肿瘤周围放射组学模型;CIPRM,结合肿瘤内和 6 毫米肿瘤周围放射组学模型;CM,临床-放射学模型;NM,列线图模型。
总结
总之,结合肿瘤内和肿瘤周围放射组学特征以及临床放射学因素的 NM 具有高性能,能够早期预测乳腺癌患者新辅助化疗后的 pCR 状态,为临床选择适当的治疗方案、及时调整治疗策略和预后评估提供重要信息。
|