|
8 个 AD 数据集包括 755 名 AD 患者。具体来说,数据集GSE106241包括 60 个样本,而 GSE118553 有 301 个样本,GSE122063 有 56 个样本,GSE132903 有 97 个样本,GSE28146 有 22 个样本,GSE48350 有 80 个样本,GSE5281 有 87 个样本,GSE84422 有 43 个样本。接下来,通过集成和规范化这些数据集,作者能够提高数据分析的稳健性和可靠性。然后,使用共识集群将 AD 患者分为两种 AD 亚型。采用 CDF(累积分布函数)来确定影响最大稳定性的 k 值。Delta 面积图表明,在 k = 2 后,曲线下的面积急剧减少(图 1A-C)。根据 RCD 相关基因的 mRNA 表达,PCA 图描绘了两种 AD 亚型之间的差异(图 1D)。在两个集群中鉴定出 DEGs 后,确定了两个集群中的 245 个共享 DEGs(图 1E,补充表 2)。GO 和 KEGG 分析显示,这些 DEGs 主要富含跨突触信号传导、神经元对神经元突触、多巴胺能突触、轴突导向和神经变性通路的调节,表明这些 DEGs 可能在 AD 发展中发挥关键作用(图 1F-G)。
接下来,作者比较了两种 AD 亚型的临床特征。值得注意的是,簇中的 γ 分泌酶活性、β 分泌酶活性、淀粉样蛋白-β 42 水平和 α 分泌酶活性显著升高。A 患者与集群相比。GSE106241 中的 B 患者(图 2A-D)。结果还显示,braak、斑块、NFT、临床痴呆评级,而不是 PH 在集群中经历更高。A 患者与集群相比。B 患者在 GSE84422 中(图 2E-I),而 MMSE 在集群中显着降低。A 患者与集群相比。GSE48350 中的 B 患者(图 2J)。这些结果表明,集群中的患者。一个亚型比集群中的亚型显著加速了 AD 进展。B 亚型。更有趣的是,该集群中女性患者的年龄和数量明显更高。A 患者与集群相比。元队列中的 B 患者(图 2K 和 L)。
通过使用 ESTIMATE 算法,研究人员观察到 cluster.与集群相比,一组表现出更高的免疫评分、基质评分和估计评分。B 组。此外,使用 7 种算法分析了基于免疫细胞群的免疫景观。在簇之间免疫细胞群的相对分布中观察到显着差异。A 和集群。B 组和集群。与集群相比,一组表现出更高的免疫细胞群。B 组(图 3A,补充图 2)。此外,免疫调节剂在集群中较高。群集中的组。B 组(图 3B,补充图 3)。簇的主要途径 (Wnt 信号通路、JAK-STAT 信号通路)活性。A 显著高于 cluster。B(图 3C,补充图 4)。总之,患者聚集。一组表现出更大程度的免疫浸润、更高的免疫调节剂和更高的通路活性,这可能是导致 AD 进展的原因。
为了识别与 AD 进展相关的关键模块基因,应用了 WGCNA 算法。首先,计算元队列中每个基因之间的 Pearson 相关系数。结果表明,当 β 为 3 时,达到 R2=0.85 的水平(图 4A)。接下来,通过计算模块间的差异构建基因模块的树图,最终得到 14 个模块(图 4B)。结果表明,turquoise 模块与 cluster 呈负相关。一组 (r=-0.67,P<0.001,图 4C)。此外,GO 和 KEGG 分析显示,在生物过程中,关键模块基因主要富集在神经变性途径中,例如突触前内吞作用、囊泡介导的突触转运、突触后致密、突触后特化和 GABA 能突触(图 4D 和 E)。总之,这些结果表明这些关键模块基因可能在 AD 发展中发挥关键作用。最后,选择了两种 AD 亚型之间的 DEGs 中的 23 个重叠基因以及与 AD 进展相关的关键模块基因进行进一步研究(补充表 3)。
为了进一步探索 23 个基因特征,作者进行了人工智能 (10 种机器学习算法,113 种组合) 来筛选出潜在的预测因子。然后计算 12 个最佳枢纽基因的表达,并通过这些基因的回归系数进行加权,以计算每个患者的风险评分(图 5A,补充表 4)。根据方法部分,一个有趣的发现揭示了 RF(随机森林)成为突出的模型,在所有人工智能算法中获得了最高的平均 AUC (0.802)(图 5B)。具体来说,作者使用 ROC 曲线分析对整个队列进行了评估,以确定 RCD.score 的有效性。在训练数据集 (GSE1) 中发现 AUC 为 000.118553。验证队列 (GSE106241:0.789 、 GSE122063:0.814 、 GSE132903:0.757 、 GSE28146:0.769 、 GSE48350:0.728 、 GSE5281:0.758 和 GSE84422 :0.799 )分别显示出相似的结果。由于上述发现,RCD.score 表现出非凡的稳定性和在众多独立队列中进行推断的能力。
接下来,作者使用前面提到的技术进行了广泛的分析,以提取已发布的签名。该分析的目的是评估和比较 RCD.score 与与 AD 相关的其他特征的有效性。最后获得线粒体、泛细胞凋亡、铜固醇、铁死亡、免疫、氧化、ICD (免疫原性细胞死亡)、m12G、TCR (T细胞抗原受体)、染色质、代谢、m7a 等 6 篇文章。对于每个签名,作者计算了 AUC,并最终注意到 RCD.分数达到最大 AUC(图 5C)。由于 RCD.score 是通过采用多种机器学习算法的融合获得的,因此模型对 RCD.score 的预测(由 AUC 衡量)的性能明显优于其他签名。
接下来,采用 GSEA 来探索高/低 RCD.score 组之间的潜在机制。结果显示,神经退行性变通路,如神经元到神经元突触、神经递质分泌、帕金森病和阿尔茨海默病(图 6A 和 B)。然后,作者探讨了 RCD.score 与其临床特征之间的相关性。值得注意的是,与低 RCD 相比,高 RCD.score 组的 γ 分泌酶活性、β 分泌酶活性、淀粉样蛋白-β 42 水平和 α 分泌酶活性显著升高。GSE106241 中的分数组(图 6C-F)。结果还显示,在高 RCD 中,braak、斑块、NFT 和临床痴呆评级更高。评分组与 GSE84422 中低 RCD.score 组相比(图 6G-J),而与 GSE48350 中低 RCD.score 组相比,高 RCD.score 组的 MMSE 明显较低(图 7k)。这些结果表明,高 RCD.score 组的患者比低 RCD.score 组的患者显著加速了 AD 进展。更有趣的是,与元队列中的低 RCD.score 组相比,高 RCD.score 组的年龄明显更高(图 6L)。此外,集群中的 RCD.score 和高 RCD.score 患者的数量明显更高。A 患者与集群相比。元队列中的 B 患者(图 6M 和 N)。
通过采用 ESTIMATE 算法,研究人员观察到,与低 RCD.score 组相比,高 RCD.score 组表现出更高的免疫评分、基质评分和 estimate 评分。此外,与低 RCD.score 组相比,高 RCD.score 组显示出更高的免疫细胞群(图 7A,补充图 5)。此外,高 RCD.score 组的免疫调节剂高于低 RCD.score 组(图 7C)。高 RCD.score 组的主要途径 (wnt 信号通路,JAK-STAT 信号通路) 活性显著高于低 RCD.score 组 (图 7B,补充图 6)。总之,高 RCD.score 组的患者表现出更大程度的免疫浸润、更高的免疫调节剂和更高的通路活性,这可能是导致 AD 进展的原因。
根据 FinnGen 数据库,作者确定了 130 个与 AD 相关的风险基因(图 8A)。GO 和 KEGG 分析显示,这些风险基因主要富集于神经系统发育调节、神经元死亡、突触组织和突触囊泡周期等神经变性通路。值得注意的是,作者发现免疫相关通路,如 Th1 和 Th2 细胞分化以及 Th17 细胞分化显著富集,表明这些免疫可能在 AD 发展中发挥关键作用(图 8B 和 C)。然后,在之前建模的 12 个基因中,有 4 个被认为是 AD 的风险基因(图 9A)。接下来,SMR 表明 4 个基因表达与 AD 发作之间存在显着的因果关系(图 9B-E)。
总结
作者根据 RCD 相关基因确定了两种不同的亚型,每种亚型都表现出不同的标志性通路活性和免疫学景观。具体来说,就是集群。A 患者免疫浸润水平较高,免疫调节剂水平较高,AD 进展不良。利用这些亚型的共享 DEGs 和 WGCNA,作者构建了一个 RCD。分数,在多个数据集中表现出出色的 AD 预测能力。此外,RCD.score 被确定与不良 AD 进展表现出最强的相关性。从机制上讲,作者在高 RCD.score 组中观察到信号通路的激活以及有效的免疫浸润和免疫调节剂,从而导致不良的 AD 进展。
|