《Radiation Oncology》 2025年12月11日在线发表印度尼西亚和澳大利亚的Made Agus Mahendra Inggas , Sindy Apriani 2 , Lutfi Hendriansyah ,等撰写的《在立体定向放射外科治理前庭神经鞘瘤后,鉴别假性进展与真实肿瘤生长:基于体积和临床轨迹的分析。Distinguishing pseudoprogression from true tumor growth after stereotactic surgery in vestibular schwannoma: a volumetric and clinical trajectory analysis》(doi: 10.1186/s13014-025-02753-1.)。
简介:
在放射外科治疗前庭神经鞘瘤(VS)后常会出现一过性的肿胀现象(“假性进展”,简称 PP),这种现象与真正的进展(TP)相似。我们验证了体积计算规则,以区分 PP 和 TP,并将生长模式与临床结果联系起来。
前庭神经鞘瘤(VS)是一种源自第VIII对颅神经前庭部分的施万细胞的良性肿瘤,据估计每年每10 万人中约有 1 例发病。手术切除,尤其是立体定向放射外科(SRS)已成为主要的治疗手段,其肿瘤控制率通常在 90%或更高。然而,SRS 治疗后肿瘤增大的现象,即所谓的假性进展(PP),给临床管理带来了复杂性,因为这种现象在影像学上类似于真正的肿瘤生长,但往往代表的是短暂的炎症反应而非真正的疾病进展[ the phenomenon of tumor enlargement after SRS, commonly termed pseudoprogression (PP), complicates clinical management, as it mimics true tumor growth radiologically yet often represents a transient inflammatory response rather than genuine disease progression]。Prasad 等早期的伽马刀(GK)手术系列研究是最早指出这种治疗后一过性肿胀现象,并提出早期明显的肿大并不一定意味着治疗失败的案例之一。随后的研究,包括Balossier 等人最近基于轨迹的分析,强调了 VS 在 SRS 后可以遵循多种体积演变模式,从早期的一过性肿胀到后期的消退再到持续的渐进性增长不等。将PP 理解为真正的进展(TP)可能会导致不必要的干预、给患者带来焦虑以及可能的过度治疗。将 PP 理解为真正的进展(TP)可能会导致不必要的干预、给患者带来焦虑以及可能的过度治疗。
由于影像学特征存在重叠,要从临床角度区分PP(假性进展)与实际肿瘤生长仍具有挑战性。这种情况通常在治疗后6 至 18 个月内出现在约 15%至 30%接受过手术治疗的 VS患者中[7]。影像学监测主要依赖于体积评估、磁共振成像(MRI)增强模式和症状发展轨迹,但目前的临床标准缺乏明确、普遍认可的准确区分这些现象的准则。因此,神经外科医生和神经耳科医生在管理策略上存在显著的差异,这凸显了需要建立可靠的、客观的参数,将体积数据和临床数据相结合,以更可靠地指导治疗决策。
鉴于这些临床方面的不确定性以及现有标准的局限性,本研究旨在对接受立体定向放射外科治VS患者进行深入的体积和临床轨迹分析。通过系统地评估体积增长模式、临床症状以及轨迹结果,本研究旨在阐明可靠的预测因素,并提出客观的标准以准确区分PP与TP 。
方法:
我们对2012 年至 2024 年期间接受单次立体定向放射外科治疗的 259 例散发性前庭神经鞘瘤病例进行了回顾性研究。放射外科治疗采用的平均边缘剂量为12 Gy,剂量范围设定在该机构的周边等剂量线内,使用了平均5 个等中心点。在连续的磁共振成像检查中,对肿瘤进行了手动分割,时间间隔不少于 24 个月。假性进展(PP)定义为在 12 个月内体积增加超过 20%,随后在 24 个月内减少至少 10%;真正进展(TP)定义为在 36 个月以上有超过 15%的体积增加且持续增长。还测试了两种不同的阈值(任何时间点的增加超过 25%;24 个月内增加超过 10%但无回退)。使用高斯混合模型对纵向轨迹进行聚类。结果包括听力、面部和三叉神经功能以及DHI。
这项研究是在我们医疗机构进行的一项回顾性观察性队列研究,涵盖了2012 年 1 月至 2024 年 12 月期间接受治疗的所有患者。该研究方案已由机构伦理审查委员会审查并批准(批准编号:#634/SHLV-HA/B/IV/25)。
所需资格标准:(1)年龄≥18 岁,(2)在立体定向放射外科治疗前四周内进行过一次高分辨率对比增强磁共振成像(MRI),(3)至少进行两次间隔不少于 6 个月的随访 MRI 检查,以及(4)有完整的听力、面部和三叉神经状况的临床记录。排除标准为:神经纤维瘤病 2 型、既往进行过显微手术或分次放射治疗、影像质量不佳或随访时间少于 24 个月。
所收集的变量包括人口统计学信息(年龄、性别)、肿瘤特征(初始体积大小、Koos分级、侧别、囊性成分)以及治疗参数(Gy边缘剂量、处方等剂量线、等中心点数目)。临床结果包括纯音平均值、言语辨别分数、House–Brackmann面神经分级、三叉神经感觉减退情况以及每次随访时的眩晕残疾指数。数据由两名作者从电子病历中提取,并录入一个专门的、设有密码保护的数据库中,随后进行交叉核对以确保准确性。
所有患者均按照医疗机构规定采用单次伽玛刀立体定向放射外科疗法进行治疗,剂量为中位值12 Gy,施加于周边等剂量线,共使用中位数5 个等中心点。所有磁共振成像均在 1.5 特斯拉扫描仪上进行,采用标准化方案(含钆的 T1 加权成像,T2 FIESTA/CISS 成像)。
在轴向T1 造影后的序列中,通过专用工作站对肿瘤体积进行了分割。所有增强的肿瘤体积均由一位经过专门培训、在前庭神经鞘瘤成像方面经验丰富的神经放射科医生手动勾勒。未进行正式的第二评估者分割或观察者间差异分析。对于具有不典型囊性或不规则形态的病例,神经放射科医生会重新检查,并在必要时在单独的审查环节中细化轮廓,然后再将体积导出进行分析。
主要的评估指标是根据预先设定的体积规则对影像学轨迹进行分类,分为PP(相对肿瘤体积增加超过 20%,在 SRS 治疗后12 个月内持续增加,24 个月后至少减少 10%)和 TP(体积增加超过 15%,发生在 36 个月之后,且此后持续增大或继续增大)。另外,还评估了两个额外的候选阈值以用于诊断性能分析:任何时间点的单次增加超过 25%,以及 24 个月后增加超过 10%但随后未出现回降的情况。次要指标包括听力保留情况(PTA ≤ 50 分贝且言语辨别能力 ≥ 50%)、新的面神经麻痹(House-Brackmann 分级≥ Ⅱ级)、新的三叉神经感觉减退、PTA 的变化以及从基线到最后一次随访期间头晕残疾指数的变化。
先前的研究表明,立体定向放射外科治疗(SRS)后的肿瘤缓解率约为 17% 。我们计算得出,至少需要 192 名患者才能达到 80%的检验效能(α = 0.05,双侧检验)。考虑到因随访不完全而导致的预计 10%的患者脱落,目标入组人数应为 212 名患者。
所有的统计处理均在RStudio 2024.06.0 + 421 环境中(R 版本 4.4.1)进行,使用了 tidyverse(dplyr、tidyr、ggplot2)、mclust、splines、pROC 和 logistf 等包。数据分布通过肖皮尔-威克检验和 Q-Q 图进行评估;由于连续变量不符合正态分布,数值则以中位数(四分位间距)的形式进行汇总。纵向体积轨迹通过自然三次样条系数的高斯混合聚类模型(mclust)进行建模,个体肿瘤进程则通过使用 ggplot2 生成的意面图进行可视化。候选体积阈值的诊断性能通过受试者工作特征分析(pROC)进行评估,曲线下面积的 95% 置信区间通过 DeLong 方法计算得出。双侧 p 值 < 0.05 被认为具有统计学意义。
结果:
出现了四个生长模式群:早期PP 模式(35.5%)、晚期 PP 模式(11.2%)、稳定模式(41.3%)和 TP 模式(12%)。PP 规则(rule)的敏感度为86%,特异度为 93%(AUC 为 0.92);TP 规则的敏感度为 77%/特异度为 95%(AUC 为 0.90)。其他阈值的表现较差(AUC 为 0.81 - 0.85)。在≥86%的 PP 或稳定肿瘤中,听力功能得以保留,但在 TP 中仅 61%(p < 0.01)。
讨论:
立体定向放射外科(SRS)已成为VS治疗的基石疗法,因为它能在单次门诊治疗中以高度精准的方式给予放射外科治疗,同时还能保护神经功能;最新的系列研究显示,局部肿瘤控制率超过 90%,与显微手术的结果相当,且颅神经损伤更少。与此同时,磁共振成像技术的广泛应用揭示了每 10 万人中约有 3 至 5 例新病例的年发病率,这使得小肿瘤能够更早被发现,而这些小肿瘤非常适合采用微创手术策略。治疗后的监测现在依靠的是连续的体积磁共振成像,而非单纯的线性直径测量,因为近三分之一的病变会出现短暂的体积扩张,这可能类似于真正的生长,但最终会自行消退而无需额外治疗。因此,精确的体积分析提供了区分良性炎症性肿胀与具有生物活性进展所需的定量分辨率,从而指导医生及时采取干预措施,保护听力,并避免不必要的补救性手术[Accurate volumetric analysis therefore provides the quantitative resolution needed to distinguish benign inflammatory swelling from biologically active progression, guiding clinicians in timely intervention, safeguarding hearing, and avoiding unnecessary salvage procedures]。
当前的研究表明,立体定向放射外科治疗后,VS通常会出现假性进展(PP),其特征为一过性的体积增大,最终会稳定或消退,无需进一步干预。相比之下,一小部分患者则出现了持续的肿瘤生长,这与真性进展(TP)相符,同时伴有严重的听力下降和颅神经功能障碍等不良临床后果。值得注意的是,明确的体积阈值被证明是极为有效的诊断工具,能够以临床可操作的方式准确区分这两种情况。这种区分使临床医生能够自信地采取保守的监测策略,在VS病例中避免因过早的补救治疗而带来的不必要的并发症。
这些发现与现有文献相一致,同时又对其进行了拓展。现有文献通常报告放射外科治疗后假性进展(PP)的发生率在 10% 至 30% 之间。 Balossier等人最近的研究进一步表明,在伽玛刀放射外科治疗后,VS可以呈现出不规则的体积变化轨迹,包括一过性肿胀随后逐渐消退,以及持续增长等,这强调了简单的“控制型与进展型”二元分类是不够准确的。以往的研究主要依靠线性直径测量来评估肿瘤反应,而这种体积测量方法则具有更高的准确性和更好的预测价值。先前的研究报告了各种体积阈值,其敏感性范围在 70% 至 80% 之间;然而,当前研究的规则表现出了更出色的性能,其敏感性和特异性超过了 85%。这种更高的准确性与之前的回顾性系列研究相吻合,突显了体积测量作为区分PP与TP的新兴标准的重要性。
体积阈值相较于传统线性评估具有更出色表现的原因在于,它们能够捕捉到复杂的三维肿瘤形态变化,从而更准确地反映潜在的生物学过程。放射外科引起的炎症和坏死反应通常会导致由于水肿、血管充血和囊肿形成而引起的暂时性增大,这些现象最适合通过体积测量来量化。此外,线性直径测量常常低估不规则或不对称的生长,从而可能导致潜在的误判。因此,体积成像在区分生物上无活性、可逆的反应与真正的、持续的肿瘤增殖方面具有更高的敏感性。在我们的研究中,符合 PP 规则的肿瘤表现出良好的长期放射学行为和较高的听力保留率,而符合 TP 规则的肿瘤则更有可能继续生长、需要补救治疗,并出现具有临床意义的恶化。
这些规则可以被纳入一个简单的后续处理算法中。对于那些在立体定向放射外科(SRS)治疗后早期出现体积增加且符合 PP 规则、且神经功能保持稳定的患者,按照常规的时间间隔进行定期监测是合适的,医生可以向患者保证短暂的肿胀是一种预期的、自限性的现象。相反,当体积变化超出 PP 规则但尚未达到 TP 标准时,需要采取谨慎的处理方式,缩短影像检查间隔并加强临床监测。符合 TP 规则的肿瘤,即在 36 个月后增长超过 15%且持续增大的肿瘤,尤其是在听力或颅神经功能恶化的情况下,应促使多学科团队讨论补救性手术或重复进行 SRS。将体积变化规则与听力测试趋势和症状演变相结合,有助于进行更细致的患者咨询:符合 PP 规则的早期肿胀可以被描述为“放射性噪音”而非失败,而符合 TP 规则的生长模式则表明存在更高的真实进展可能性,并需要讨论及时干预的必要性。
同时,必须认识到一些应用中的潜在问题和限制。首先,应避免对超出推荐时间窗口的单次测量结果进行过度解读;这些规则是基于特定的时间基准制定的,而在其他时间段的孤立偏差可能会产生误导。其次,我们的阈值是在仅使用单次分割的伽马刀立体定向放射外科治疗(GK SRS)治疗VS中得出的,不应不加批判地将其推广到 NF2 相关肿瘤、先前接受过照射的病变、或显著不同的 SRS 方案或平台上。第三,即使 AUC 较高,仍会有小部分肿瘤不可避免地会被误分类;因此,体积规则应作为临床判断和与患者共同决策的补充,而非替代。分割和测量误差,特别是在非常小或高度不规则的肿瘤中,可能会在边缘处影响分类,这突显了保持一致方法的重要性,未来在可能的情况下,还应采用自动化或半自动化工具。
从临床角度来看,将体积指标与临床评估相结合对于实现个性化患者管理至关重要。准确的体积区分能够避免不必要的干预及其相关的风险,比如进一步的听力损失、面神经损伤或三叉神经功能障碍等。此外,体积阈值为临床决策提供了一个标准化、客观的框架,减少了实践模式中的差异性。最终,采用体积分析能够增强医生向患者准确传达预期结果和干预措施的能力,从而有助于提高前庭神经鞘瘤治疗的整体医护质量和患者满意度。
本研究存在若干局限性,对此需予以认可。首先,回顾性单中心设计存在潜在的选择偏差,而且真正具有进展性的肿瘤数量相对较少,这可能会夸大诊断性能的评估结果。其次,所有的体积分割均由一位经过专门培训的神经放射科医生手动完成;虽然这确保了内部一致性,但并未进行正式的多评估者或观察者间差异分析,因此不可避免地存在一些测量误差。第三,所有影像均在 1.5-T 扫描仪上使用单一机构的协议获取,且未进行明确的图像协调程序,这可能限制了其在使用不同扫描仪或协议的中心中的普遍适用性。第四,随访计划和临床评估并未完全标准化,平均影像随访时间为 48 个月,可能无法捕捉到非常晚期的进展。最后,体积规则是在同一研究队列内部自行制定和验证的。开展具有自动或半自动分割功能的多中心前瞻性研究,并延长监测时间,这对于确认其有效性以及完善这些阈值至关重要,以便将其纳入常规临床应用中。
结论:
基于时间的体积测量标准能够准确地区分放射外科治疗后的一过性肿胀与真正的进展。将这些标准纳入常规监测中,可以避免过早进行补救性治疗,同时确保对少数确实有肿瘤生长的患者能够及时采取干预措施。
通过应用两个简单的基于时间的体积衡量规则,即在12 个月内体积增加超过 20%,随后在 24 个月内体积减少≥10%;以及在 36 个月后持续出现体积增加超过 15%的情况,能够准确区分PP与TP。在放射外科治疗前庭神经鞘瘤后应用这些规则,能够更好地区分这两种肿瘤类型。这些标准在性能上优于其他阈值设定,并且与更好的听力保护和更低的颅神经并发症率相一致。将这些数值基准纳入常规监测中,可以避免大多数患者接受不必要的补救性治疗和焦虑,同时仍能识别出真正需要进一步干预的少数肿瘤。尽管我们的回顾性单中心设计存在一定的局限性,但庞大的样本量、细致的体积分割和稳健的建模支持了其普遍适用性。有必要开展前瞻性多中心研究,采用自动分割和延长随访时间,以进一步完善这些阈值,并验证其在基于证据的前庭神经鞘瘤管理中的有效性。