Advanced Radiation Oncology》 20257月2日在线发表美国North Carolina州的Duke University的Jingtong Zhao , Eugene Vaios , Evan Calabrese ,等撰写的《用于识别立体定向放射外科治疗非小细胞肺癌患者脑转移瘤后放射性坏死的放射基因组深度集成学习模型。A Radiogenomic Deep Ensemble Learning Model for Identifying Radionecrosis Following Brain Metastases (BM) Stereotactic Radiosurgery in Patients With Non-small Cell Lung Cancer BM》(doi: 10.1016/j.adro.2025.101826. )。

目的:

立体定向放射外科(SRS)在治疗脑转移瘤(BM)方面应用广泛,但放射性坏死的风险给术后管理带来了挑战。由于目前缺乏非侵袭性的影像学方法来区分放射性坏死与复发,我们旨在设计一个深度集成学习模型,该模型将患者的临床特征和基因组信息整合起来,以识别接受 SRS 治疗后出现影像学进展的脑转移瘤患者的放射性坏死情况。

脑转移瘤(BM)是成人中最常见的颅内肿瘤,美国每年有超过 20 万例新病例被确诊。1 约 10%至 20%的癌症患者会患上脑转移瘤。 由于其较高的局部控制率,立体定向放射外科(SRS)治疗越来越被用于治疗脑转移瘤。 但 20%至 30%的患者在治疗后会出现影像学进展,这可能反映了放射性坏死(RN)或真正的复发(TR)。 RN 是一种延迟的放射性对正常脑组织的损伤,单独使用放射治疗的病例中其发生率为 5%至 10%, 当与免疫疗法结合使用时,这一比率可能会较高。诊断上的挑战在于区分 RN 和 TR,因为这两种情况都表现出相似的症状, 和影像学表现,因此需要进行手术活检以明确诊断。治疗策略在有症状的 RN 和 TR 之间存在显著差异。有症状的 RN 通常用皮质类固醇或贝伐单抗进行治疗, TR 则需要局部干预,如手术或再次放疗,因此准确诊断至关重要。每年,美国有 4 万至 5 万名患有转移瘤转移性肿瘤的癌症患者会出现疑似转移瘤的影像学变化,其中约有 1.5 万人存在误诊和不当治疗的风险。

手术活检仍是区分特发性震颤(TR)与退行性震颤(RN7)的金标准,但其存在一定的并发症风险,可能会延误治疗,并且对于患有多个脑部病变或病变位于手术难以触及区域的患者而言,往往也不可行。 因此,开发非侵袭性诊断工具对于促进及时和准确的治疗管理至关重要。专门的神经影像学方法,包括基于质子的光谱分析和结合药代动力学建模的延迟对比磁共振成像(MRI),已被提出。 然而,由于需要专门的设备和进一步的验证,这些技术尚未被纳入广泛的标准治疗实践之中。

为了诊断立体定向放射外科(SRS)治疗后的神经放射性损伤(RN),人们探索了多种放射学方法。磁共振成像(MRI)常用于 SRS 治疗后的随访评估,20 但其无法可靠地区分 RN 与肿瘤复发(TR),这是因为影像学和症状特征(如水肿和神经认知缺陷)存在重叠。10,13 为解决这一诊断难题,包括影像组学和传统机器学习在内的计算方法已被采用。10,16,21,22 这些方法涉及从影像数据中提取与纹理、形状和体积相关的特征,并将其用于有监督算法中的分类。22, 23, 24, 25 基于影像组学的模型显示出了令人鼓舞的结果,其特异性值在 0.74 至 0.90 之间,曲线下面积(AUC)值在 0.71 至 0.81 之间。但敏感性仍然相对较低,通常在 0.52 至 0.65 之间,导致总体准确率在 0.67 至 0.74 之间。这种性能差距引发了对漏诊和治疗延误的担忧。影像协议、采集参数和软件工具的一致性差异导致了不同研究之间的一致性和通用性降低。 这些技术上的差异可能会对敏感性产生特别的影响,因为识别细微的成像模式往往依赖于一致的输入数据。这些局限性凸显了需要改进策略以同时提高敏感性和特异性。深度学习(DL)作为一种有望解决这些局限性的策略,通过先进的计算模型来捕捉复杂的和细微的成像模式而发挥作用。 DL 算法在从医学图像中辨别复杂的模式和特征方面表现出卓越的能力,从而提高了预测的准确性。在 DNN 设计中将图像数据(例如病理学、放射影像学)与非图像数据(例如人口统计学、基因图谱)相结合具有巨大的潜力。但是,由于不同临床模态的信息和数据格式存在差异,有效融合多模态数据仍然具有挑战性。 因此,在预测治疗反应和 TR/RN 结果时,将临床和基因特征与基于图像的深度特征相结合的有效性尚未得到充分探索。

在本研究中,我们旨在开发一种深度集成学习模型,以区分脑转移瘤(BM)患者影像学检查后出现病变扩大的患者中的放射性坏死(RN)与肿瘤复发(TR)。我们假设将患者的临床特征和基因组信息整合到深度集成学习框架中,能够提高模型的敏感性和整体性能。为了解决从不同来源融合数据时出现的维度不匹配问题,将低维度的临床/基因组特征按位置编码到一个丰富的特征空间中,以补充从磁共振成像中提取的高维度深度特征。

方法与材料:

我们研究了62 名非小细胞肺癌患者的 90 个脑转移瘤(BM),其中 27 例为经活检证实的术后立体定向放射外科(SRS)局部复发病例。收集了临床特征和分子特征。使用术后 3 个月的 T1+c 磁共振成像数据,训练了一个深度神经网络(DNN)用于放射性坏死/复发预测。在二元预测输出之前,提取了潜在变量作为 1024 个深度特征。然后开发了一个集成学习模型,该模型由两个融合深度特征与临床(“D+C”)或基因组(“D+G”)特征的子模型组成。我们采用了位置编码方法,以最优方式将低维临床/基因组特征与高维图像特征融合在一起。每个子模型中的融合后特征在全连接层后生成了一个对数结果。集成模型的最终输出是这 2 个子模型的对数结果通过逻辑回归合成的结果。模型训练采用了 8:2 的训练/测试比例,并开发了 10 个模型版本以进行稳健性评估。性能指标与仅基于图像的 DNN 模型以及“D+C”和“D+G”子模型进行了比较。

结果:

【文献摘要】用于识别立体定向放射外科治疗非小细胞肺癌患者脑转移瘤后放射性坏死的放射基因组深度集成学习模型

深度集成模型在测试集上的表现令人满意,其受试者工作特征曲线下的面积(ROCAUC)为 0.91 ± 0.04,敏感性为 0.87 ± 0.16,特异性为 0.86 ± 0.08,准确率为 0.87 ± 0.04。这一结果显著优于仅基于图像的深度神经网络结果(ROCAUC = 0.71 ± 0.05,敏感性 = 0.66 ± 0.32)。与“D+C”结果(ROCAUC = 0.82 ± 0.03,敏感性 = 0.67 ± 0.17)和“D+G”结果(ROCAUC = 0.83 ± 0.02,敏感性 = 0.76 ± 0.22)相比,其平均表现也更为出色。

讨论:

转移BM)的发病率持续上升,而立体定向放射外科(SRS)仍是主要的治疗手段之一。然而,SRS 治疗的一个显著并发症是出现有症状的放射性神经损伤(RN),这极大地影响了患者的生活质量。 难以诊断,因为它在随访影像检查中常常与肿瘤复发(TR)表现相似,这使得脑转移瘤的治疗决策变得复杂。目前 RN 的治疗选择包括药物治疗和手术切除。然而,通常用于治疗肿瘤复发(TR)的再照射可能会加重有症状的 RN,导致潜在的并发症和死亡风险。由于手术活检存在风险,获取复发的病理确认并非总是可行的。因此,迫切需要先进的诊断工具来优化转移瘤转移患者的治疗管理。

多种先进的成像技术已被用于探究其区分放射性坏死RN)与转移瘤(TR)的潜力,但每种技术都存在重要的局限性。磁共振波谱分析能够提供有关组织代谢和肿瘤微环境的重要信息,但其临床应用受到诸如小病灶大小、靠近骨骼或空气界面以及缺乏标准化采集参数等因素的限制。 磁共振灌注成像,尤其是相对脑血容量,能够提供有关肿瘤血管情况的见解,因为复发性肿瘤通常会表现出更高的灌注度。然而,放射性坏死和转移瘤的相对脑血容量值常常重叠,且测量结果可能会受到病变位置、伪影以及协议变异性的影响。正电子发射断层扫描(PET),使用诸如氟脱氧葡萄糖或氨基酸类似物等示踪剂,显示出提高诊断准确性的潜力。然而,氟脱氧葡萄糖 PET 受到正常脑组织中高背景摄取的限制,而氨基酸示踪剂的临床应用则受到现场放射性示踪剂生产的限制。此外,正电子发射断层扫描成像可能会存在空间分辨率有限和信号与噪声比低的问题,这会降低其在实际应用中的可靠性。在这种情况下,人工智能作为及时进行转移瘤移植管理的决策支持工具具有巨大的潜力。

在本研究中,我们提出了一种新颖的放射基因组深度集成学习框架,该框架将体积磁共振成像数据、患者临床特征以及基因组特征整合在一起,以区分患有转移性病变且在立体定向放射治疗后出现影像学进展的患者中的肿瘤复发(TR)和放射性坏死RN)。据我们所知,我们的集成模型是此类首次应用,它将临床和基因组特征与深度学习技术相结合,用于区分立体定向放射治疗后的肿瘤复发/放射性坏死。使用基于图像和非图像数据的性能最佳模型取得了令人鼓舞的预测性能,其 AUCROC 值为 0.91 ± 0.04,敏感性为 0.87 ± 0.16,特异性为 0.86 ± 0.08,准确率为 0.87 ± 0.04。这一成就突显了我们方法在利用全面的数据整合来提高转移瘤病变管理中的诊断准确性方面的有效性。尽管德隆检验的 P 值在经过霍尔姆-邦费罗尼校正后未达到统计学显著性——这可能是因为样本量有限,但对于脑转移瘤放射性坏死研究来说,这个样本量仍然是相当可观的——但观察到的模型性能指标的趋势仍值得关注。具体而言,所提出的集成模型在敏感性、特异性和 AUC 方面的表现始终优于其他模型,这表明其具有提升临床决策诊断准确性的潜力。虽然 P 值是评估统计显著性的一个有价值工具,但它们存在局限性,特别是在样本量较小或数据复杂且维度较高的研究中。 从统计学上讲,不显著并不意味着缺乏科学意义或无实际用途。我们研究结果中观察到的趋势表明了进一步研究的有希望的方向,并强调了通过使用更大规模的数据集来验证这些发现以确认其可靠性的重要性。未来具有更大规模多中心数据集和更多临床验证的研究将对确定集成模型对患者医疗的实际影响至关重要。

在以往的研究中,已证明将临床特征或基因组特征纳入深度学习框架中是有效的。34,46 但是,在深度学习环境中这两种类型特征的联合作用仍未得到探索。在这项工作中,我们旨在解决在整合来自不同来源的数据时经常出现的维度问题。当将低维度的临床特征与高维度的深度图像特征融合时,维度的差异可能会阻碍有效的数据融合以及后续的模型预测。为了克服这一挑战,我们使用了 PE,这是一种在基于转换器的模型中常用的、主要用于捕捉序列信息的技术。47 具体来说,PE 被用作一个向量扩展方案,将临床特征的维度扩展到更高维度的嵌入空间中。我们方法的关键成果是提高了数据融合的质量。应用 PE 所得到的丰富特征空间有效地补充了高维度的深度成像特征。因此,这提高了数据融合的整体质量,并且进而对我们的模型的预测结果产生了积极的影响。

PE 已被证明能够有效地融合两个数据源:一个维度高,另一个维度低。然而,当试图将两种非图像特征与基于深度图像的特征相结合时,融合过程会变得更加复杂。融合顺序的选择和嵌入空间的维度会显著影响融合的质量,并且在单个 DNN 模型中平衡来自三个不同数据源的贡献是一项具有挑战性的任务,因为每个源都必须对预测做出有意义的贡献,同时又不能掩盖其他源的影响。18,42 为了解决这个问题,我们采用了集成学习方法,以利用由两个独立的 PE 过程实现的最佳数据融合。先前的研究表明,深度集成学习模型结合了深度学习和集成学习的优势,从而实现了更好的泛化性能。48 传统的集成方法通常涉及使用相同数据的不同模型或使用不同数据的相同模型。我们的模型采用了后一种策略。具体而言,我们的组合设计将深度图像特征与临床特征或基因组特征相结合作为输入,确保在训练过程中具有多样性。这一策略旨在减少相关学习错误,为模型提供更具多样性和全面性的数据集。通过比较这两个子模型的结果,我们的组合模型表现出了更好的性能,这证明了这些子模型通过相互补充而非单独运行实现了整体性能的提升。

不同数据源特征之间的相互作用对于提升模型性能具有重要意义。在所研究的 3 种类型中,影像特征构成了模型准确性的基础,这可能是因为它们能够捕捉到脑转移瘤BM)及其周围组织的详细空间和结构信息,这对于在立体定向放射治疗(SRS)后区分放射性坏死RN)和肿瘤性放射性坏死TR)至关重要。影像数据有可能提供有关疾病形态的高分辨率信息,例如坏死区域或肿瘤复发模式,这些信息提供了标量临床或基因特征无法完全体现的详细结构背景。这就是为什么在集成模型中两次使用影像特征会对其准确性产生显著贡献的原因,因为它们直接反映了疾病状态的可观察变化,使其成为准确预测不可或缺的要素。临床特征对模型准确性的贡献大于基因特征,这一点从“D+C”子模型比“D+G”子模型的更高性能中可以得到证明。这可以归因于临床数据能够捕捉到患者特有的因素,例如整体健康状况、治疗历史以及全身反应等,这些因素与影像学结果和疾病预后直接相关。这些特征提供了具有可操作性的、以患者为中心的见解,对于区分放射性坏死RN)和肿瘤复发TR)更为直接相关。相比之下,基因组特征虽然对于理解分子机制具有生物学意义,但往往缺乏在影像或临床数据中可观察到的直接解剖或功能关联。将临床和基因组数据与影像相结合,进一步通过在详细的疾病形态上叠加互补的生物学背景来提高模型性能。例如,临床特征提供了有关患者特定反应或易感条件的见解,而基因组数据则突出了遗传倾向和分子特征,如肿瘤的侵袭性或对放射治疗的敏感性。这种分层组合很可能反映了转移瘤进展和对立体定向放射外科(SRS)反应的复杂生物学机制,而影像则捕捉到可观察到的结构变化,临床/基因组数据则添加了上下文层,从而增强了患者特异性。

本研究存在以下局限性:其研究为回顾性性质,且样本量较小,仅来自单一机构。我们所采用的集成模型使用了 T1+c 磁共振序列的数据,这是脑转移瘤立体定向放射治疗规划和监测的主要影像学方式。然而,使用其他影像学模态的研究已证明在预测放射治疗结果方面表现良好。 因此,将多种影像学模态整合到多模态模型中可能是一个值得探索的有益方向。未来,我们将与同行机构合作,采用统一的数据收集协议,前瞻性地验证该模型。另一个局限性是我们的样本集中关注的是患有非小细胞肺癌的患者,这可能限制了我们研究结果对其他原发性癌症(如黑色素瘤或乳腺癌)所致脑转移瘤的相关性。为了增强脑转移瘤预测模型的可靠性和相关性,我们未来的研究将涵盖更广泛的患者群体。此外,本研究中使用经活检确认的脑转移瘤引入了一种潜在的选择偏差,因为活检决策很可能基于临床判断而非标准化的程序。这可能意味着,在 TR 类别中,只有某些患者(比如健康状况较好、愿意接受侵入性检查或转移瘤样本获取途径更便利的患者)的比例会过高。这种偏差表明,需要对具有标准化活检标准的数据集进行外部验证,或者理想情况下,需要前瞻性数据来提高模型在不同临床环境中的适用性。尽管存在这些局限性,但当前的放射基因组深度集成模型相较于现有的放射组学和深度神经网络模型而言,具有显著的进步意义。其在改善非侵入性区分 RN 和/TR 方面的潜力对于改善患者管理并指导治疗策略具有重要的临床意义。

结论:

在本次研究中所评估的模型中,深度集成模型在利用3 个月后立体定向放射外科治疗后的 T1+c 磁共振图像、临床特征以及基因组特征来区分转移瘤放射性坏死与复发方面表现最佳。这表明人工智能在转移瘤管理的临床决策中具有潜力,值得进一步研究其临床应用价值。

我们成功开发了一种新型的放射基因组深度集成模型,该模型能够利用术后3 个月的 T1+c 磁共振成像有效地将转移瘤放射性坏死与复发区分开来。结果表明,该集成模型的 AUCROC 结果为 0.91±0.04,敏感性为 0.87±0.16,表现良好。这一突破凸显人工智能在脑转移瘤管理临床决策工具中的潜在应用价值。该模型在临床应用中的潜在影响值得进一步研究。