导语

结果:

单变量 MR 分析
共确定了 1424 个独立的与 BMI 相关的 SNP 作为工具变量,所有这些 SNP 都表现出极低的弱工具变量偏倚可能性(F 统计量≥28.26,附加文件 2)。在显著性水平为 0.05 的情况下,作者具有 80%的把握检测到遗传预测的 BMI 对 eBMD 的影响,其最小效应量(β)为 0.01(每增加 5-kg/m²)。
如图2 所示,作者观察到基因预测的 BMI 与 eBMD 之间存在显著的保护性关联(β IVW = 0.13,95%置信区间[95%CIs] = 0.11 ~ 0.15,P 值 = 1.28 × 10 −34 ),个体 SNP 估计值之间存在异质性(P Cochran’sQ < 0.05,附加文件 2)。IVW 分析的结果在所有敏感性分析中均具有统计学显著性和方向一致性。MR-Egger 回归(β MR-Egger = 0.17,95%CIs = 0.11 ~ 0.23,P 值 = 8.11 × 10 −9 )和加权中位数方法(β weighted median = 0.13,95%CIs = 0.11 ~ 0.14,P 值 = 8.00 × 10 −59 )在很大程度上支持了 IVW 分析的结果。在移除 198 个多效性 SNP(β IVW = 0.13,95%CIs = 0.11 ~ 0.16,P 值 = 1.80 × 10 −31 )或 171 个回文 SNP(β IVW = 0.14,95%CIs = 0.11 ~ 0.16,P 值 = 2.72 × 10 −31 )后,IVW 分析的结果基本未发生改变。留一分析和 MR-PRESSO 分析表明,观察到的 MR 估计值未受到任何异常变异的影响。 作者也观察到,在采用原始全基因组关联研究(GWAS)报告的仪器变量(IVs)时,基因预测的 BMI 与 eBMD 之间存在一致的防护性关联,这验证了重新聚集的 IVs 对 BMI 的可靠性(β IVW = 0.13,95%置信区间(CIs)= 0.09 ~ 0.16,P 值= 3.62 × 10 −17 ,图 2 )。

纯孟德尔随机化还能发7+??都来看看别人是怎么找突破口的!
BMI 和 eBMD 的单变量孟德尔随机化分析结果。a 概括单变量孟德尔随机化(MR)分析结果的森林图。蓝色方块表示点估计值;水平线表示 95%置信区间。b 表示每次排除一个单核苷酸多态性(SNP)以估计 BMI 对 eBMD 影响的留一法分析的箱线图。β的估计值表示基因预测 BMI 每增加 5-kg/m2 。上、中、下线分别描绘了β值的上四分位数、中位数和下四分位数。从箱体顶部和底部延伸的线表示最大值和最小值。异常值用散点表示。BMI,身体质量指数;eBMD,估计骨密度;SNP,单核苷酸多态性;GWAS,全基因组关联研究
MR-Clust 分析
作者在单变量 MR 观察到的稳健关联基础上,继续使用 MR-Clust 评估 BMI 与 eBMD 之间潜在的分化因果通路。根据严格的变异数量和条件概率标准,BMI 的遗传变异被分为六个实质性簇。簇 1 至簇 3 分别包含 13、63 和 227 个变异,继续显示出对 eBMD 的积极影响,而簇 4 至簇 6 包含 68、19 和 10 个变异,则表现出负面影响(图 3)。每个簇内未观察到异质性(所有 P Cochran’sQ > 0.05)。

MR-Clust 结果显示在孟德尔随机化分析中,BMI 对 eBMD 的因果效应存在聚集性异质性。只有当条件概率≥0.8 时,变异才会被分配到某个簇,并且只有至少有四个变异被分配到簇时才会显示簇。每个遗传变异由一个点表示。误差线表示遗传关联的 95%置信区间。颜色代表簇,虚线代表簇均值。BMI,身体质量指数;eBMD,估计骨密度
通过富集分析确定了不同的生物学通路,其中正向效应簇(簇 1-3)中的 SNP 与神经元过程更相关,而负向效应簇(簇 4-6)中的 SNP 更多地参与细胞生长和发育调控(附加文件 2)。经过多重检验校正(Benjamini-Hochberg),GO 分析显示簇 1-3 中的 SNP 在轴突发育(GO:0061564)方面显著富集,而簇 4-6 中的 SNP 在细胞生长(GO:0016049)、细胞形态发生调控(GO:0022604)、神经元投射发育调控(GO:0010975)、解剖结构大小调控(GO:0090066)以及轴突发育(GO:0061564)方面显示出富集。KEGG 分析中未发现任何通路通过多重检验校正。
组织分区的孟德尔随机化分析
由于 MR-Clust 提供了关于 BMI 与 eBMD 之间关系不同路径的证据,作者进一步进行了组织分区的孟德尔随机化分析,以估计不同 BMI 亚组分与 eBMD 之间的独立因果关联。在完成共定位分析后,作者分别确定了 230、218 和 236 个 SNP,用于骨骼肌、内脏脂肪和皮下脂肪组织的 BMI 工具变量(附加文件 2)。组织分区工具变量的 BMI 平均效应大小相当。
作者识别出证据表明,在单变量孟德尔随机化分析中,肌肉组织校正的 BMI(β IVW = 0.18,95%置信区间为 0.11 ~ 0.26,P 值=2.40 × 10 −6 )、内脏脂肪组织校正的 BMI(β IVW = 0.18,95%置信区间为 0.10 ~ 0.26,P 值=7.20 × 10 −6 )、皮下脂肪组织校正的 BMI(β IVW = 0.16,95%置信区间为 0.09 ~ 0.24,P 值=5.10 × 10 −5 )对 eBMD 具有未校正的保护性作用(图 4 )。然而,在分别调整 BMI 的其他两个表型亚组分后,内脏脂肪组织校正的 BMI、皮下脂肪组织校正的 BMI 与 eBMD 之间的关联在多变量孟德尔随机化分析中减弱至无关联。值得注意的是,肌肉组织校正的 BMI 与 eBMD 之间的保护性关联在调整内脏脂肪组织校正的 BMI 后仍具有边缘显著性,且略微减弱(β IVW = 0.14,95%置信区间为 0.00 ~ 0.28,P 值=4.98 × 10 −2 ,图 4 )。在采用更宽松的 PPH4 > 0.7 阈值的 IV 扩展集进行的敏感性分析中,结果高度一致。

BMI 和 eBMD 的分层 Mendelian 随机化分析结果。单变量 Mendelian 随机化(MR)分析分别估计了皮下脂肪组织、内脏脂肪组织和骨骼肌组织仪器 BMI 对 eBMD 的未调整效应。多变量 MR 分析在考虑其他亚组分效应后估计了 BMI 每个表型亚组分的独立效应。蓝色方块代表点估计值;水平线代表 95%置信区间。BMI,身体质量指数;eBMD,估计骨密度;SNP,单核苷酸多态性
补充孟德尔随机化分析
为验证骨骼肌通路是否独立地驱动了 BMI 对 eBMD 的影响,作者利用关于身体成分表型的 GWAS 数据进行了补充孟德尔随机化研究。作者获得了与 LM 相关的 981 个 SNP 作为工具变量,以及 917 个与 FM 相关、92 个与 BFP 相关和 992 个与 BW 相关的 SNP。单变量孟德尔随机化分析显示,遗传预测的 LM 与 eBMD 之间存在未校正的保护性关联(β IVW = 0.02,95%置信区间为 0.01 ~ 0.04,P 值=8.50 × 10 −3 )。多变量孟德尔随机化分析进一步表明,在调整 FM(β IVW = 0.07,95%置信区间为 0.05 ~ 0.09,P 值=2.51 × 10 −13 )、BFP(β IVW = 0.04,95%置信区间为 0.02 ~ 0.05,P 值=1.06 × 10 −5 )、BMI(β IVW = 0.07,95%置信区间为 0.05 ~ 0.08,P 值=1.92 × 10 −16 )或 BW(β IVW = 0.13,95%置信区间为 0.09 ~ 0.17,P 值=6.33 × 10 −11 ,图 10 和附加文件 2)后,这种保护性关联显著增强。

进行单变量和多变量孟德尔随机化分析以估计瘦体重对 eBMD 的总效应和独立效应的结果。蓝色方块表示点估计值;水平线表示 95%置信区间。β的估计值以遗传预测的瘦体重每增加 5kg 表示。eBMD,估计骨矿物质密度;SNP,单核苷酸多态性;FM,脂肪质量;BFP,身体脂肪百分比;BMI,身体质量指数;BW,体重
敏感性分析
使用 BMI-GWAS(2015)效应量进行单变量 MR 分析的结果与作者的结果保持一致。MR-Clust 分析也显示出一致的模式,其中簇 1-3 对 eBMD 保持正向效应,簇 4-6 保持负向效应,这证实了作者研究结果的稳健性。组织分区的 MR 分析结果保留了相似的作用方向,但独立骨骼肌组织 BMI 效应的统计显著性有所降低,这可能是由于统计功效下降所致,提示未来需要使用更大的独立数据集进行验证。

总结

作者的研究存在一些局限性。首先,尽管 eBMD 具有显著的遗传成分,并且是可获得的最大 GWAS 汇总数据集,但作者的研究仅关注 eBMD 作为骨质疏松症替代指标,可能限制了研究结果对其他部位骨密度的普适性。未来需要进一步研究 BMI 对特定部位骨密度的作用。其次,虽然作者首次通过使用组织分区孟德尔随机化框架,为 BMI 与 BMD 之间的肥胖悖论提供了新视角,但由于数据限制,作者分析中的 eQTL 数据样本量小于 1000 人,这可能影响结果的稳健性,并导致在组织分区孟德尔随机化多变量分析中 F 统计量较小(<10[ 72 ]。尽管样本量较小,作者仍发现了一些提示性证据,表明未来研究应使用更大规模的数据集验证这些发现(当可用时)。此外,尽管作者的分析仅关注骨骼肌和脂肪组织,但这并不排除其他组织和通路参与 BMI-eBMD 关系。 第三,UKB 参与者在不同暴露和结果数据集中的交集可能使作者的估计产生偏差[ 73 ]。尽管双样本孟德尔随机化研究可以安全地应用于大型生物样本库数据[ 74 ],并且作者使用了强效工具,并通过非交集的 GWAS 数据验证了主要发现,但未来使用更大规模非交集数据集进行验证仍然有益。最后,骨质疏松症的患病率在男性和女性之间存在显著差异[ 75 ];然而,由于数据限制,本研究未探讨性别差异。当性别特异性 GWAS 和 eQTL 数据可用时,有必要进行进一步研究以填补这一空白。