源自风暴统计网:一键统计分析与绘图的网站
11月26日,国外学者在《Nature》上发表了一篇重磅Meta分析性研究,对“经济不平等会侵蚀心理健康”的共识发起挑战,发现经济不平等对主观幸福感与心理健康的整体元分析效应接近于零。
这篇文章不仅结论引人深思,更集合了各种前卫Meta分析理念与方法:交叉随机效应模型、等效检验、元分析规格曲线分、机器学习探索调节变量……其在方法学上的含金量之高,真的让人拜读!
那么,研究者是如何一步步得出结论,我们能借鉴什么呢?
搜索范围涵盖心理学、社会学、政治学、教育学等多个学科;同时联系了超过150名研究人员,获取了那些未发表的研究;
最终,样本的广度和深度远招以往的元分析(以往研究仅包含9-24项研究):
168项研究(152篇文章),覆盖2000-2022年的研究,涉及75个二手数据集和13个原始数据集;共包含11,389,871 名独立被试、38,335 个地理单元。数据涵盖多国数据集、美国、中国以及若干全球南方国家
为了不同原始指标与模型间可以对比,研究者将原始效应量转化为标准化优势比OR_{+0.05},表示基尼系数每增加0.05单位,结局(主观幸福感和心理健康)发生有意义变化的比值比。
因此,OR_{+0.05}是一个实际意义很强的政策友好型指标,它表示:
当经济不平等上升0.05时,人们在心理健康/幸福方面发生明显改变的概率,会增加/减少多少比例?
交叉随机效应模型:主效应分析
传统的Meta分析一般假设效应量在研究间或研究内存在差异,但这篇文章还考虑到了数据库的重叠(例如,两个研究使用同一数据集)。
研究者使用交叉随机效应模型对主效应进行分析。这样一来,模型中就同时包含了数据集间异质性、文章间异质性、研究间异质性和研究内异质性,能够更好地减少统计偏差。
结果表明,经济不平等与主观幸福感无显著关联(OR_{+0.05}=0.979, 95%CI=0.951–1.008, P=0.155)。
作者对这一结果并没有满足于p>0.05,而是继续进行了等效性检验,发现效应量小于“最小关注效应”,即从公共政策或心理机制角度看强度微弱到实际为0。
等效性边界设为[1/1.05, 1.05]。由于对应的对数比值比为log[OR_{+0.05}] = ±0.0488(即r ≈ ±0.01),该数值远低于小效应的阈值,因此若效应量90%CI落在该区间内,可忽略不计。
异质性分析表明,主观幸福感的跨研究差异很大(I²总体约98%),其中主要差异来源于文章之间和数据集之间的不同,而非抽样误差,Q151 = 1,848,P < 0.001。
结果显示,经济不平等与心理健康显著负相关,OR_{+0.05}= 0.961, 95% CI [0.940, 0.983], p < 0.001。
异质性分析显示,Q98 = 400,P < 0.001;预测区间宽而跨越零(−0.190-0.112),说明未来研究也可能发现正效应或无效应。
这一显著结果似乎能与主流观点相符,但研究者并没有止步于此,而是思考了一个重要的问题:发表偏倚。
发表偏倚指的是阳性结果的研究更容易被发表,导致Meta分析高估效应量。研究者使用了一整套极其全面的方法来检测和矫正,这是非常罕见的:
心理健康元分析的漏斗图呈明显不对称,表明具有较大标准误的研究中,出现过多的负向估计。
Egger多层元分析回归(Egger–MLMA)也证实了这一点:回归斜率 B₁ = −1.219(95% CI [-1.675, -0.763],p < .001)。
这些结果表明小样本研究,即使其结果可能不稳健,也更容易被发表。
研究者用了9种统计方法以修正小样本效应、检验选择性报告和P值操纵(P hacking)。结果显示,纠正该偏倚后,经济不平等与心理健康之间的关联完全消失。
这些证据表明,以往的经济不平等对心理健康的负面效应很大程度上是由学术界的发表偏倚和小样本研究造成的假象。
元分析规格曲线分析:稳健性测试
大家在做元分析的时候肯定会遇到很多决策:如何处理多重效应量、用什么模型、用什么估计方法……这些看似微小的决策有可能会改变显著性。
那么,怎么应对这种决策不同、结果不同的问题,并且发高分文章呢?这篇文章的作者提供了一个很好的实例:元分析规格曲线分析。
元分析规格曲线分析:为检验某一关系而在合理研究决策范围内构建的所有可能模型,并呈现有多少比例的结果支持零假设,从而检验结论是否仅仅是特定分析下的偶然产物。
94.3%的估计不显著,中位数效应量OR_{+0.05}=0.972,P=0.308;
在未校正的估计中,68.5% 显著负向;但偏倚矫正后,93.4%的估计不显著,中位数效应量为OR_{+0.05}=1.018, P=0.266,证实了在发表偏倚校正后,二者之间缺乏显著关联。
这表明,无论采取哪种分析方法,先前的结论都具有极高的稳健性。
由于主效应存在较大的异质性,研究者进行了多种新颖的调节变量探索:
-
-
机器学习:用随机森林从世界银行等数据库筛选大量宏观指标(人均收入、通胀、失业率等);再在元回归中正式检验;
-
-
平均收入是经济不平等-心理健康的调节变量:在低收入样本中,不平等显著预测了更差的心理健康,OR_{+0.05}=0.933;在高收入样本中,关联不显著;
-
通货膨胀是经济不平等-主观幸福感的调节变量:高通胀下,不平等预测了更低的主观幸福感(OR_{+0.05}=0.936);低通胀下,不平等预测了更高的主观幸福感(OR_{+0.05}=1.045);
-
外部数据(Gallup世界民意调查)验证均复现了以上结果。
这篇文章通过全面而系统的分析,不仅论证了经济不平等和心理健康不存在关联,还识别出了两个关键调节变量:收入和通货膨胀。这具有很强的政策指导意义:最大化减少绝对贫困,而非仅聚焦于基尼系数等相对不平等指标。
从方法论上看,这篇文章可以说是Meta分析各种方法的集大成之作,它的惊艳之处在于:不是方法的堆砌,而是创新且合理地运用。
比如针对未显著的效应,作者没有停在p>0.05,而是考虑到微小的不平等效应在现实中或许会积累成显著的后果,因而创造性地做了等效性分析——判断这个效应是不是小到可以忽略。
所以,统计方法绝不是越多、越复杂越好,更重要的是透明性、稳健性、可重复性真的做到了吗?
|