现在,很多文献,尤其是用公共数据库发表的文章,都开始使用多模型策略,而不是先单后多。
多模型策略又叫焦点因素分析,通过校正不同的协变量同时建立多个模型(model 1、model2、model3…..)。
JAMA子刊文章多模型策略示例
为何研究者越来越青睐多模型策略呢?一起探讨一下!
在医学统计中,构建模型的目的有三:
  • 一是风险因素发现模型;
  • 二是验证风险因素模型;
  • 三是临床预测模型。
三种模型的目的不同,因此,构建模型的策略不同,对应的构建方法也不同。
三种模型构建目的和方法
1.风险因素发现模型
风险因素发现模型,这也是国人最常见的论文撰写方式,目的就是发现某医学结局事件发生的独立的风险因子。探讨多个X与Y的关联,对所有自变量”一视同仁”。
一般采用“先单后多”的策略,最终模型中,P<0.05确认为独立的风险因子。
2.验证风险因素模型
该模型构建的目的很单纯,就是验证某个因素X与Y之间的关系,即重点关注某一个X与Y的关联。
为什么越来越多的研究开始使用多模型策略?Model 1、Model 2…
但X和Y之间的关系,很可能被其他一些因素干扰,因此,需要校正其他因素可能对X和Y之间关系的的影响。
所以,构建模型会:
  • 先构建X和Y之间的单因素分析模型Model1
  • 然后在X的和Y模型的基础上,继续增加控制其他X2、X3因素的影响,构建Model2
  • 然后继续增加X4、X5等等因素影响Model3
如此,直到把专业上认为的可能考虑的因素全部控制校正,如果此时X的回归系数依旧有意义,那么,就可以证明,X确实对Y有影响。
比如研究吸烟与肺癌的关系,吸烟就是我们关注的焦点暴露因素X,肺癌为结局Y,其他指标(X1、X2、X3、X4、X5……)如性别、年龄、慢性病史等,可能对吸烟行为、肺癌发生产生影响的变量,即为混杂因素,也是协变量。
这就是我们今天所讲的多模型策略。
3.临床预测模型
临床预测模型建模的目的在于预测,也就是更加关注结局事件Y被模型预测的准不准,因此,此时研究重点,并不是考虑某个X对Y有无影响,而是考虑如何选出一个多个X的组合,让这个组合预测Y更加准确。
三种模型构建方法如何实现

今天提到的这些方法,浙中大郑老师团队基于R语言开发的风暴统计平台均可以实现,并且配备了全套教程。

1.先单后多分析策略

也就是我们经常看到的“先单后多”,也就是单因素回归+多因素回归。根据结局变量的不同数据类型,选择不同的回归方法。

且分析结果以发表级三线表呈现,下载后直接放进文章中。
Zstats教程(5):相关与线性回归方法
Zstats教程(7):logistic回归分析方法
Zstats风暴统计教程(9):生存分析方法
2.多模型策略
通俗来讲,多模型策略就是构建多个回归模型。风暴统计平台早已上线了此功能。
链接直达:http://zstats./logisticcon/
并且同时配备了三种回归方法。
我们以二分类结局为例,构建logistic回归多模型。
首先,导入数据后进入【Logistic回归多模型策略】板块。
选择因变量、焦点暴露因素,随后可点击【增加回归模型】,构建多个logistic回归模型。
分别在模型2、模型3中选入要调整的协变量,最多可增加到模型5。
点击分析,右侧会给出三线表结果。
篇幅有限,平台配备了详细的教程,小白照做即可!
Zstats教程(6):线性回归控制混杂偏倚
Zstats教程(8):Logistic回归控制混杂偏倚
Zstats风暴统计教程(10):Cox回归控制混杂偏倚

3.临床预测模型

风暴统计平台配备多个临床预测模型链接,包括logistic回归和cox回归两种建模方法,因不作为本文重点,诸位可以自行使用。