现在,很多文献,尤其是用公共数据库发表的文章,都开始使用多模型策略,而不是先单后多。
多模型策略又叫焦点因素分析,通过校正不同的协变量同时建立多个模型(model 1、model2、model3…..)。
三种模型的目的不同,因此,构建模型的策略不同,对应的构建方法也不同。
风险因素发现模型,这也是国人最常见的论文撰写方式,目的就是发现某医学结局事件发生的独立的风险因子。探讨多个X与Y的关联,对所有自变量”一视同仁”。
一般采用“先单后多”的策略,最终模型中,P<0.05确认为独立的风险因子。
该模型构建的目的很单纯,就是验证某个因素X与Y之间的关系,即重点关注某一个X与Y的关联。
但X和Y之间的关系,很可能被其他一些因素干扰,因此,需要校正其他因素可能对X和Y之间关系的的影响。
-
-
然后在X的和Y模型的基础上,继续增加控制其他X2、X3因素的影响,构建Model2;
-
如此,直到把专业上认为的可能考虑的因素全部控制校正,如果此时X的回归系数依旧有意义,那么,就可以证明,X确实对Y有影响。
比如研究吸烟与肺癌的关系,吸烟就是我们关注的焦点暴露因素X,肺癌为结局Y,其他指标(X1、X2、X3、X4、X5……)如性别、年龄、慢性病史等,可能对吸烟行为、肺癌发生产生影响的变量,即为混杂因素,也是协变量。
临床预测模型建模的目的在于预测,也就是更加关注结局事件Y被模型预测的准不准,因此,此时研究重点,并不是考虑某个X对Y有无影响,而是考虑如何选出一个多个X的组合,让这个组合预测Y更加准确。
今天提到的这些方法,浙中大郑老师团队基于R语言开发的风暴统计平台均可以实现,并且配备了全套教程。
也就是我们经常看到的“先单后多”,也就是单因素回归+多因素回归。根据结局变量的不同数据类型,选择不同的回归方法。
并且分析结果以发表级三线表呈现,下载后直接放进文章中。
通俗来讲,多模型策略就是构建多个回归模型。风暴统计平台早已上线了此功能。
链接直达:http://zstats./logisticcon/
我们以二分类结局为例,构建logistic回归多模型。
首先,导入数据后进入【Logistic回归多模型策略】板块。
选择因变量、焦点暴露因素,随后可点击【增加回归模型】,构建多个logistic回归模型。
分别在模型2、模型3中选入要调整的协变量,最多可增加到模型5。
3.临床预测模型
风暴统计平台配备多个临床预测模型链接,包括logistic回归和cox回归两种建模方法,因不作为本文重点,诸位可以自行使用。
|