PROM-成人脊柱畸形患者报告结局指标｜GSJ专刊综述

PROM评估

最常用的是SF-12/SF-36，这两者均按0–100分评分，100分代表健康状态最佳。

SF-36通过36个问题评估8个健康维度。

SF-12作为一种简化版本，包含12个问题，完成时间约为SF-36的三分之一。

VAS和NRS评估疼痛

Visual Analog Scale (VAS) and Numerical Rating

Scale (NRS)

VAS要求患者在一条线段上，通过视觉提示从“无痛”到“极痛”标示出自己当前的疼痛程度，随后由临床医生将该标示位置转换为数值评分，其中10代表最严重的疼痛。

NRS则是直接让患者在0到10的数字线上选择一个数字来表示自己的疼痛强度。

ODI（Oswestry Disability Index）是一项用于评估下腰痛致残程度的10题问卷，总分为0–100分，100分代表最严重的功能障碍。常用的修订版本中，将原本涉及性生活功能的一道题替换为关于疼痛强度的题目。

SRS系列问卷（22题、24题和30题版本）最初是为青少年特发性脊柱侧凸设计的，后来被改编用于成人脊柱畸形（ASD）患者的评估。

SRS-24为最早开发的版本，但Asher等人对该工具的测量属性提出质疑，因此进一步开发了具有更高信效度的SRS-22，自此SRS-22成为ASD研究中被广泛接受的“金标准”PROM。不过，SRS-22并未纳入术后健康状态的相关问题。

SRS-22评估的四个维度包括：身体功能、疼痛、自我形象及心理健康。这些维度可以合并为一个总分，以减少多重比较所带来的统计误差，但这种合并也会损失各维度独有的特异性和精细性。

为弥补术后状态测量的不足，研究者又开发了SRS-30，增加了相关维度中术后状态的题目。此外，SRS-22的修订版（SRS-22r）通过改善结构效度，现已成为脊柱畸形患者首选的PROM工具。为促进临床和研究中的标准化使用，Scoliosis Research Society网站已移除其他版本的SRS问卷，仅保留推荐使用的版本。

在这项关于成人脊柱畸形（ASD）患者报告结局指标（PROMs）的系统评价中，并未涵盖EuroQol系列工具，包括：EQ-5D-5L、EQ-5D-3L 以及 EQ-5D-Y。这些量表通过五个维度（行动能力、自我照护、日常活动、疼痛/不适和焦虑/抑郁）各设一道题来评估患者健康状况

除了提供各个健康维度的数据外，EuroQol工具的结果还可换算为“质量调整生命年”（QALYs），用于健康经济学研究。QALYs的评分范围为0至1，1代表1年完全健康的生命状态。通过对治疗前后在一段时间内获得或失去的QALYs进行总和，可估算干预的健康收益，并进一步用于计算治疗的成本效益比。

不过，由于这类工具的问题较少，较难识别出患者健康感知的细微变化，因此在临床实践中不常被使用。尤其是EQ-5D-3L，因选项设置较少，患者往往倾向选择中间选项（如：“我有一些问题”），而不是“两端”的明确态度（“我没有问题”或“我有很多问题”），这进一步限制了其敏感性。

近年来，PROMIS问卷系统的开发提供了更多优势。PROMIS是一个涵盖特异性健康特质（如疼痛干扰、身体功能、抑郁、焦虑等）的问卷库。这种结构与传统通用健康评估工具（如SF-36）或疾病特异性工具（如SRS-22）有所不同，使得医生或患者可按需定制问卷内容以捕捉特定关注领域。

值得注意的是，PROMIS支持“计算机自适应测试”（CAT），其基于项目反应理论（IRT），可根据患者每一道题的回答智能选择下一题。与传统PROM工具（如采用经典测验理论的SRS-22或ODI）不同，传统方法需要患者完成所有题目才能评估健康状况（如ODI的10道题），而CAT则通过动态选题，通常在4至6题内即可完成问卷，大幅降低了患者的答题负担和医生的评估时间。

此外，PROMIS得分采用T分制，解释也更为直观：平均值为50，标准差为10，得分越高代表该特质越强。例如，较高的“疼痛干扰”得分说明患者的疼痛影响较大。

PROMIS相比SRS-22r和SF-36的另一大优势在于：它能将“抑郁”和“焦虑”作为两个独立概念进行评估，而非如传统工具中将其混合为单一的“心理健康”维度。

如何评价

鉴于目前可用于成人脊柱畸形（ASD）研究的问卷种类繁多，Scoliosis Research Society（脊柱侧凸研究学会）支持发起了“脊柱侧凸核心结局研究”（COSSCO），旨在明确一套最小测量领域及其对应的患者报告结局指标（PROMs）。该研究遵循“治疗效果核心结局测量指南”（COMET）倡议的推荐方法。COMET的目标是在各临

床学科中定义“核心结局集”（COS），作为临床研究的最低标准。

第一步，研究通过系统评价总结出ASD研究中涉及的29个结局领域，并根据世界卫生组织的国际功能、残疾和健康分类（WHO-ICF）进行分类，同时识别出7种常用PROM工具。

第二步，经验丰富的脊柱畸形外科专家采用改良Delphi法进行了7轮投票，最终确定了适用于ASD患者的核心结局集（COS），需在基线（术前）和术后1年两个时间点收集。

在结局设定过程中，既考虑了患者的体验（PROM），也纳入了临床状态（如死亡、新发神经功能缺损）和远期结局（如假关节形成）等医生视角。

最终纳入的PROM工具包括：

EQ-5D 3L：通用健康测量工具；

SRS-22r：疾病特异性测量工具；

ODI v2.1a：功能障碍量表；

数字疼痛评分量表（NPRS，0–10分）：分别用于评估腰背痛和腿痛。

这些量表因具备良好的信效度，并已被翻译为多种语言而被选中。需要注意的是，由于目前没有任何一个PROM工具可以涵盖ASD的所有关键领域，因此需要联合使用多个量表。EQ-5D 3L 提供通用健康评估，而 SRS-22r 提供疾病特异性评估，有助于全面反映患者自我感知的健康状态。

专家组建议在基线和术后1年收集腰背痛和腿痛的NPRS评分。此外，还建议在随访中增加两个问题：恢复工作的时间以及完全康复的时间。

常规临床建议在术后1年进行随访，术后6个月和2年的随访则建议用于研究目的。该COS的总题量为：基线时40题，随访时42题。

随后，AO Spine脊柱畸形知识论坛（AO Spine Knowledge Forum Deformity）采纳了COSSCO提出的最具相关性的PROM框架，用以描述个体化的ASD患者特征图谱。

在成人脊柱畸形（ASD）中，评估患者多个可能受累或未受累的领域（如外观、疼痛、功能和心理健康）是必要的。因此，在COSSCO所推荐的PROMs（EQ-5D 3L、SRS-22r、ODI v2.1a，以及腰背/腿痛的NPRS）基础上，研究人员采用类似的Delphi方法，进一步筛选出了用于评估“脊柱特异性状态”（Spine-specific Status）领域的PROM工具。

患者的治疗预期对其对疗效的主观判断（成功或失败）具有显著影响。为此，该研究将“可信度/预期问卷”（CEQ）中的第4题加入核心结局集中，使总问题数增至41个。CEQ第4题要求患者以10%的递增方式（从0%到100%）估计其预期的改善程度。

与COSSCO不同，该研究未收集“恢复工作时间”和“完全康复时间”等数据，因为其研究重点是建立ASD患者特征图谱，用于分类这一异质性人群。

两个专家共识小组所推荐的问卷可用于多维度评估ASD特异性结局。值得一提的是，EQ-5D 3L数据还可转换为“质量调整生命年”（QALYs），用于健康经济学分析。尽管两套工具在问题内容上高度重合（共40题），并已形成较强共识，但未提及“应答疲劳”的问题——这在临床实践中使用大量问卷时需加以关注。

治疗的评价

PROMs可用于量化健康变化并评估手术的成功或失败。

第一：有统计学意义的临床指标并非就是理想的治疗效果；

第二：患者是否临床获益？有统计学意义的最小改善还是显著改善？

第三：即使有所改善，但是若未达到预期，患者仍可能不满意，例如ODI从60降至40，患者从“严重残障”变为“中度残障”，仍可能不满意。为此提出了“患者可接受症状状态（PASS）”，即患者认为自身健康状态可接受时PROMs的阈值。PASS不依赖于基线值，能识别“改善但仍不满意”的患者。

正如Dougados 所说：“感觉变好当然不错，但感觉良好才是目标。”

第四，在承担了高成本和高风险手术需引入风险-收益平衡，引入了“最小值得效果（SWE）”。它将患者预期、成本和风险承受能力纳入考虑，理想情况下通过“风险-获益权衡”方法计算。例如，在考虑三柱截骨术引起神经损伤风险时，患者可能会要求较MCID更显著的改善。ASD领域亟需进一步研究SWE以指导高风险、高成本手术的合理预期。

总之，PROMs本质上是以患者为中心的主观量表，难以在不同患者、年龄或文化背景下直接比较。因此，解读PROMs时应特别关注个体化变化与背景。

PROMs 是现代患者评估与外科手术疗效判断中的关键组成部分。因此，我们认同 COSSCO 专家组的建议：所有实施ASD重建手术的外科医生都应常规收集某种形式的PROMs。

未来研究还需进一步探索干预时机的界限值（阈值），

例如：

ODI<40分可考虑继续保守治疗；

ODI≥40分可考虑手术干预。

微精选

PROM-成人脊柱畸形患者报告结局指标｜GSJ专刊综述

最近文章