1

PROM评估

最常用的是SF-12/SF-36,这两者均按0–100分评分,100分代表健康状态最佳。

SF-36通过36个问题评估8个健康维度。

SF-12作为一种简化版本,包含12个问题,完成时间约为SF-36的三分之一。

VAS和NRS评估疼痛

Visual Analog Scale (VAS) and Numerical Rating

Scale (NRS) 

VAS要求患者在一条线段上,通过视觉提示从“无痛”到“极痛”标示出自己当前的疼痛程度,随后由临床医生将该标示位置转换为数值评分,其中10代表最严重的疼痛。

NRS则是直接让患者在0到10的数字线上选择一个数字来表示自己的疼痛强度。

ODI(Oswestry Disability Index)是一项用于评估下腰痛致残程度的10题问卷,总分为0–100分,100分代表最严重的功能障碍。常用的修订版本中,将原本涉及性生活功能的一道题替换为关于疼痛强度的题目。

SRS系列问卷(22题、24题和30题版本)最初是为青少年特发性脊柱侧凸设计的,后来被改编用于成人脊柱畸形(ASD)患者的评估。

PROM-成人脊柱畸形患者报告结局指标|GSJ专刊综述

SRS-24为最早开发的版本,但Asher等人对该工具的测量属性提出质疑,因此进一步开发了具有更高信效度的SRS-22,自此SRS-22成为ASD研究中被广泛接受的“金标准”PROM。不过,SRS-22并未纳入术后健康状态的相关问题。

SRS-22评估的四个维度包括:身体功能、疼痛、自我形象及心理健康。这些维度可以合并为一个总分,以减少多重比较所带来的统计误差,但这种合并也会损失各维度独有的特异性和精细性。
为弥补术后状态测量的不足,研究者又开发了SRS-30,增加了相关维度中术后状态的题目。此外,SRS-22的修订版(SRS-22r)通过改善结构效度,现已成为脊柱畸形患者首选的PROM工具。为促进临床和研究中的标准化使用,Scoliosis Research Society网站已移除其他版本的SRS问卷,仅保留推荐使用的版本。

在这项关于成人脊柱畸形(ASD)患者报告结局指标(PROMs)的系统评价中,并未涵盖EuroQol系列工具,包括:EQ-5D-5L、EQ-5D-3L 以及 EQ-5D-Y。这些量表通过五个维度(行动能力、自我照护、日常活动、疼痛/不适和焦虑/抑郁)各设一道题来评估患者健康状况

除了提供各个健康维度的数据外,EuroQol工具的结果还可换算为“质量调整生命年”(QALYs),用于健康经济学研究。QALYs的评分范围为0至1,1代表1年完全健康的生命状态。通过对治疗前后在一段时间内获得或失去的QALYs进行总和,可估算干预的健康收益,并进一步用于计算治疗的成本效益比。
不过,由于这类工具的问题较少,较难识别出患者健康感知的细微变化,因此在临床实践中不常被使用。尤其是EQ-5D-3L,因选项设置较少,患者往往倾向选择中间选项(如:“我有一些问题”),而不是“两端”的明确态度(“我没有问题”或“我有很多问题”),这进一步限制了其敏感性。
近年来,PROMIS问卷系统的开发提供了更多优势。PROMIS是一个涵盖特异性健康特质(如疼痛干扰、身体功能、抑郁、焦虑等)的问卷库。这种结构与传统通用健康评估工具(如SF-36)或疾病特异性工具(如SRS-22)有所不同,使得医生或患者可按需定制问卷内容以捕捉特定关注领域。
值得注意的是,PROMIS支持“计算机自适应测试”(CAT),其基于项目反应理论(IRT),可根据患者每一道题的回答智能选择下一题。与传统PROM工具(如采用经典测验理论的SRS-22或ODI)不同,传统方法需要患者完成所有题目才能评估健康状况(如ODI的10道题),而CAT则通过动态选题,通常在4至6题内即可完成问卷,大幅降低了患者的答题负担和医生的评估时间。
此外,PROMIS得分采用T分制,解释也更为直观:平均值为50,标准差为10,得分越高代表该特质越强。例如,较高的“疼痛干扰”得分说明患者的疼痛影响较大。
PROMIS相比SRS-22r和SF-36的另一大优势在于:它能将“抑郁”和“焦虑”作为两个独立概念进行评估,而非如传统工具中将其混合为单一的“心理健康”维度。

2

如何评价

鉴于目前可用于成人脊柱畸形(ASD)研究的问卷种类繁多,Scoliosis Research Society(脊柱侧凸研究学会)支持发起了“脊柱侧凸核心结局研究”(COSSCO),旨在明确一套最小测量领域及其对应的患者报告结局指标(PROMs)。该研究遵循“治疗效果核心结局测量指南”(COMET)倡议的推荐方法。COMET的目标是在各临

床学科中定义“核心结局集”(COS),作为临床研究的最低标准。

第一步,研究通过系统评价总结出ASD研究中涉及的29个结局领域,并根据世界卫生组织的国际功能、残疾和健康分类(WHO-ICF)进行分类,同时识别出7种常用PROM工具。
第二步,经验丰富的脊柱畸形外科专家采用改良Delphi法进行了7轮投票,最终确定了适用于ASD患者的核心结局集(COS),需在基线(术前)和术后1年两个时间点收集。
在结局设定过程中,既考虑了患者的体验(PROM),也纳入了临床状态(如死亡、新发神经功能缺损)和远期结局(如假关节形成)等医生视角。
最终纳入的PROM工具包括:
EQ-5D 3L:通用健康测量工具;
SRS-22r:疾病特异性测量工具;
ODI v2.1a:功能障碍量表;
数字疼痛评分量表(NPRS,0–10分):分别用于评估腰背痛和腿痛。
这些量表因具备良好的信效度,并已被翻译为多种语言而被选中。需要注意的是,由于目前没有任何一个PROM工具可以涵盖ASD的所有关键领域,因此需要联合使用多个量表。EQ-5D 3L 提供通用健康评估,而 SRS-22r 提供疾病特异性评估,有助于全面反映患者自我感知的健康状态。
专家组建议在基线和术后1年收集腰背痛和腿痛的NPRS评分。此外,还建议在随访中增加两个问题:恢复工作的时间以及完全康复的时间。
常规临床建议在术后1年进行随访,术后6个月和2年的随访则建议用于研究目的。该COS的总题量为:基线时40题,随访时42题。
随后,AO Spine脊柱畸形知识论坛(AO Spine Knowledge Forum Deformity)采纳了COSSCO提出的最具相关性的PROM框架,用以描述个体化的ASD患者特征图谱。

在成人脊柱畸形(ASD)中,评估患者多个可能受累或未受累的领域(如外观、疼痛、功能和心理健康)是必要的。因此,在COSSCO所推荐的PROMs(EQ-5D 3L、SRS-22r、ODI v2.1a,以及腰背/腿痛的NPRS)基础上,研究人员采用类似的Delphi方法,进一步筛选出了用于评估“脊柱特异性状态”(Spine-specific Status)领域的PROM工具。

患者的治疗预期对其对疗效的主观判断(成功或失败)具有显著影响。为此,该研究将“可信度/预期问卷”(CEQ)中的第4题加入核心结局集中,使总问题数增至41个。CEQ第4题要求患者以10%的递增方式(从0%到100%)估计其预期的改善程度。
与COSSCO不同,该研究未收集“恢复工作时间”和“完全康复时间”等数据,因为其研究重点是建立ASD患者特征图谱,用于分类这一异质性人群。
两个专家共识小组所推荐的问卷可用于多维度评估ASD特异性结局。值得一提的是,EQ-5D 3L数据还可转换为“质量调整生命年”(QALYs),用于健康经济学分析。尽管两套工具在问题内容上高度重合(共40题),并已形成较强共识,但未提及“应答疲劳”的问题——这在临床实践中使用大量问卷时需加以关注。

3

治疗的评价

PROMs可用于量化健康变化并评估手术的成功或失败。
第一:有统计学意义的临床指标并非就是理想的治疗效果;
第二:患者是否临床获益?有统计学意义的最小改善还是显著改善?
第三:即使有所改善,但是若未达到预期,患者仍可能不满意,例如ODI从60降至40,患者从“严重残障”变为“中度残障”,仍可能不满意。为此提出了“患者可接受症状状态(PASS)”,即患者认为自身健康状态可接受时PROMs的阈值。PASS不依赖于基线值,能识别“改善但仍不满意”的患者。

正如Dougados 所说:“感觉变好当然不错,但感觉良好才是目标。”
第四,在承担了高成本和高风险手术需引入风险-收益平衡,引入了“最小值得效果(SWE)”。它将患者预期、成本和风险承受能力纳入考虑,理想情况下通过“风险-获益权衡”方法计算。例如,在考虑三柱截骨术引起神经损伤风险时,患者可能会要求较MCID更显著的改善。ASD领域亟需进一步研究SWE以指导高风险、高成本手术的合理预期。
总之,PROMs本质上是以患者为中心的主观量表,难以在不同患者、年龄或文化背景下直接比较。因此,解读PROMs时应特别关注个体化变化与背景。

PROMs 是现代患者评估与外科手术疗效判断中的关键组成部分。因此,我们认同 COSSCO 专家组的建议:所有实施ASD重建手术的外科医生都应常规收集某种形式的PROMs。

未来研究还需进一步探索干预时机的界限值(阈值),
例如:
ODI<40分可考虑继续保守治疗;
ODI≥40分可考虑手术干预。