源自风暴统计网:一键统计分析与绘图的网站

11月26日,香港大学学者在医学顶刊《BMJ》(医学一区Top,IF=42.7)上发表了一项太极拳干预的临床试验研究成果,评估了它对中老年慢性失眠的治疗效果是否非劣于认知行为疗法(CBT-I)。
研究直接比较了太极拳干预与治疗慢性失眠的一线疗法CBT-I的疗效,勇气可嘉
这项临床试验采用非劣效性设计,整个研究如何设计,如何分析的,我们做了统计学解读,一起看看吧!
非劣效性临床试验研究设计
研究者采用随机、评估者盲法、非劣效性临床试验,在 2020 年 5 月 18 日至 2022 年 7 月 14 日期间招募并最终纳入了 200 名参与者。
参与者均为50 岁及以上被诊断为慢性失眠的汉族中老年人。他们被随机分配至太极组和认知行为疗法(CBT-I)组干预在香港大学内进行。
  • 太极干预组:为期三个月,包括每周两次、每次一小时的24 式杨氏太极拳课程,共 24 次;在前两个月进行太极干预,随后进行一个月的巩固训练;
  • CBT-I干预:涵盖了经典 CBT-I 组成部分,包括睡眠教育、刺激控制、睡眠限制、放松训练和认知治疗,疗程和课程安排与太极组相同。

研究者在基线、干预后(第 3 个月)和 12 个月随访(第 15 个月)时评估结局指标。

  • 主要结局:第3个月和第15个月的睡眠严重程度指数(ISI)

  • 次要结局:失眠缓解率、失眠治疗反应率( ISI 降低≥8 分)、主观睡眠数量和质量等。

太极拳可改善失眠,重在长期疗效

1. 对主要结局进行非劣效性分析

最新!港大学者发文顶刊《BMJ》,他们发现太极拳治疗失眠不逊色于一线疗法

采用 4 分的 ISI 差距(最小重要差异的 50%)来评估太极是否非劣于 CBT-I。

  • 3 个月时,太极组 ISI 评分减少了 6.67 分,而 CBT-I 组减少了 11.19 分,组间差异为 4.52 分(−∞至 5.81 分),置信区间上限超过了非劣效性界限,表明太极干预在 3 个月时劣于 CBT-I

  • 15 个月时,太极组和 CBT-I 组 ISI 评分分别减少 9.51 分和 10.18 分,组间差异为 0.68 分(−∞至 2.00 分),置信区间上限落在非劣效性界限内,表明太极干预非劣于 CBT-I

对主要结果的敏感性分析结果与主要分析结果一致。

2. 对次要结局进行广义估计方程分析

  • 失眠缓解率在第3个月,CBT-I 组和太极组存在差异(83.3% v 56.1%,P<0.001),但在第15个月相似(63.4% v 76.5%,P=0.067);

  • 治疗反应率:在第3个月,CBT-I 组和太极组也存在差异(77.4% v 43.9%,P<0.001),但在第15个月相似。

统计学解读

今天咱们看的这篇BMJ顶刊的非劣效临床试验,确实有不少干货。
首先,我们得明确非劣效试验的核心概念:它不是为了证明新疗法比标准疗法更好,而是要证明它“不差于”标准疗法。
或者说,即便疗效稍差一点,但只要这个差距在临床可以接受的范围内,同时新疗法能带来其他好处,比如副作用更小、成本更低、或者更方便,那它就很有价值。
那么,如何解读非劣效试验的结果呢?关键在于三点:
第一,看非劣效界值。这是整个研究的基石,样本量计算和结果解读都围着它转。界值定得太宽,容易得出“假非劣效”的结论;定得太严,又可能埋没了有潜力的新疗法。
这篇文章把界值定为ISI评分4分,这是最小临床重要差异(8分)的50%,而且这个标准在之前多个同类研究中都被用过,有据可依,避免了主观随意性,非常可靠。
第二,看分析数据集。非劣效试验通常要同时看两个数据集:意向性治疗集(ITT) 和符合方案集(PP)。
  • ITT集包含了所有随机入组的患者,更贴近真实世界,但它可能会把没好好治疗的人也算进来,从而“稀释”新疗法的效果,让结果更容易显得“非劣效”。
  • 而PP集只分析那些规规矩矩完成治疗的人,能更真实地反映疗法的效力。
这篇文章选用PP集作为主要分析集,这在非劣效设计中是很常见的,虽然保守,但能有效减少假阳性的风险,让结论更严谨。当ITT和PP的结果一致时,结论就非常硬气了
第三,看敏感性分析。这篇文章做得非常到位,它用了好几种方法来检验结果的稳健性:比如用了更严格的PP集,也对ITT集用了末次观察值结转(LOCF) 和多重插补这两种方法处理缺失数据。
最后研究发现,所有分析方法都得出了同一个结论:太极拳在3个月时效果不如CBT-I,但到了15个月的长期随访,它就达到了非劣效标准。这说明他们的研究结果稳健,结论立得住。
如果想详细了解一下非劣效临床试验的设计与思路,可以看看这篇推文!
统计干货 | 非劣效性检验设计及其样本量计算方法