导语

ONE

AD 中 RCD 相关基因相关亚型
8 个 AD 数据集包括 755 名 AD 患者。具体来说,数据集GSE106241包括 60 个样本,而 GSE118553 有 301 个样本,GSE122063 有 56 个样本,GSE132903 有 97 个样本,GSE28146 有 22 个样本,GSE48350 有 80 个样本,GSE5281 有 87 个样本,GSE84422 有 43 个样本。接下来,通过集成和规范化这些数据集,作者能够提高数据分析的稳健性和可靠性。然后,使用共识集群将 AD 患者分为两种 AD 亚型。采用 CDF(累积分布函数)来确定影响最大稳定性的 k 值。Delta 面积图表明,在 k = 2 后,曲线下的面积急剧减少(图 1A-C)。根据 RCD 相关基因的 mRNA 表达,PCA 图描绘了两种 AD 亚型之间的差异(图 1D)。在两个集群中鉴定出 DEGs 后,确定了两个集群中的 245 个共享 DEGs(图 1E,补充表 2)。GO 和 KEGG 分析显示,这些 DEGs 主要富含跨突触信号传导、神经元对神经元突触、多巴胺能突触、轴突导向和神经变性通路的调节,表明这些 DEGs 可能在 AD 发展中发挥关键作用(图 1F-G)。

TWO

AD 亚型的临床特征
接下来,作者比较了两种 AD 亚型的临床特征。值得注意的是,簇中的 γ 分泌酶活性、β 分泌酶活性、淀粉样蛋白-β 42 水平和 α 分泌酶活性显著升高。A 患者与集群相比。GSE106241 中的 B 患者(图 2A-D)。结果还显示,braak、斑块、NFT、临床痴呆评级,而不是 PH 在集群中经历更高。A 患者与集群相比。B 患者在 GSE84422 中(图 2E-I),而 MMSE 在集群中显着降低。A 患者与集群相比。GSE48350 中的 B 患者(图 2J)。这些结果表明,集群中的患者。一个亚型比集群中的亚型显著加速了 AD 进展。B 亚型。更有趣的是,该集群中女性患者的年龄和数量明显更高。A 患者与集群相比。元队列中的 B 患者(图 2K 和 L)。

THREE

AD 亚型免疫景观特征
通过使用 ESTIMATE 算法,研究人员观察到 cluster.与集群相比,一组表现出更高的免疫评分、基质评分和估计评分。B 组。此外,使用 7 种算法分析了基于免疫细胞群的免疫景观。在簇之间免疫细胞群的相对分布中观察到显着差异。A 和集群。B 组和集群。与集群相比,一组表现出更高的免疫细胞群。B 组(图 3A,补充图 2)。此外,免疫调节剂在集群中较高。群集中的组。B 组(图 3B,补充图 3)。簇的主要途径 (Wnt 信号通路、JAK-STAT 信号通路)活性。A 显著高于 cluster。B(图 3C,补充图 4)。总之,患者聚集。一组表现出更大程度的免疫浸润、更高的免疫调节剂和更高的通路活性,这可能是导致 AD 进展的原因。

FOUR

鉴定与 AD 进展相关的关键模块基因
为了识别与 AD 进展相关的关键模块基因,应用了 WGCNA 算法。首先,计算元队列中每个基因之间的 Pearson 相关系数。结果表明,当 β 为 3 时,达到 R2=0.85 的水平(图 4A)。接下来,通过计算模块间的差异构建基因模块的树图,最终得到 14 个模块(图 4B)。结果表明,turquoise 模块与 cluster 呈负相关。一组 (r=-0.67,P<0.001,图 4C)。此外,GO 和 KEGG 分析显示,在生物过程中,关键模块基因主要富集在神经变性途径中,例如突触前内吞作用、囊泡介导的突触转运、突触后致密、突触后特化和 GABA 能突触(图 4D 和 E)。总之,这些结果表明这些关键模块基因可能在 AD 发展中发挥关键作用。最后,选择了两种 AD 亚型之间的 DEGs 中的 23 个重叠基因以及与 AD 进展相关的关键模块基因进行进一步研究(补充表 3)。

分型+WGCNA+机器学习+GWAS,联合思路发8+,性价比也太高了!!

FIVE

RCD.score 的构建
为了进一步探索 23 个基因特征,作者进行了人工智能 (10 种机器学习算法,113 种组合) 来筛选出潜在的预测因子。然后计算 12 个最佳枢纽基因的表达,并通过这些基因的回归系数进行加权,以计算每个患者的风险评分(图 5A,补充表 4)。根据方法部分,一个有趣的发现揭示了 RF(随机森林)成为突出的模型,在所有人工智能算法中获得了最高的平均 AUC (0.802)(图 5B)。具体来说,作者使用 ROC 曲线分析对整个队列进行了评估,以确定 RCD.score 的有效性。在训练数据集 (GSE1) 中发现 AUC 为 000.118553。验证队列 (GSE106241:0.789 、 GSE122063:0.814 、 GSE132903:0.757 、 GSE28146:0.769 、 GSE48350:0.728 、 GSE5281:0.758 和 GSE84422 :0.799 )分别显示出相似的结果。由于上述发现,RCD.score 表现出非凡的稳定性和在众多独立队列中进行推断的能力。

接下来,作者使用前面提到的技术进行了广泛的分析,以提取已发布的签名。该分析的目的是评估和比较 RCD.score 与与 AD 相关的其他特征的有效性。最后获得线粒体、泛细胞凋亡、铜固醇、铁死亡、免疫、氧化、ICD (免疫原性细胞死亡)、m12G、TCR (T细胞抗原受体)、染色质、代谢、m7a 等 6 篇文章。对于每个签名,作者计算了 AUC,并最终注意到 RCD.分数达到最大 AUC(图 5C)。由于 RCD.score 是通过采用多种机器学习算法的融合获得的,因此模型对 RCD.score 的预测(由 AUC 衡量)的性能明显优于其他签名。

SIX

RCD.score 的功能注释及其临床特征
接下来,采用 GSEA 来探索高/低 RCD.score 组之间的潜在机制。结果显示,神经退行性变通路,如神经元到神经元突触、神经递质分泌、帕金森病和阿尔茨海默病(图 6A 和 B)。然后,作者探讨了 RCD.score 与其临床特征之间的相关性。值得注意的是,与低 RCD 相比,高 RCD.score 组的 γ 分泌酶活性、β 分泌酶活性、淀粉样蛋白-β 42 水平和 α 分泌酶活性显著升高。GSE106241 中的分数组(图 6C-F)。结果还显示,在高 RCD 中,braak、斑块、NFT 和临床痴呆评级更高。评分组与 GSE84422 中低 RCD.score 组相比(图 6G-J),而与 GSE48350 中低 RCD.score 组相比,高 RCD.score 组的 MMSE 明显较低(图 7k)。这些结果表明,高 RCD.score 组的患者比低 RCD.score 组的患者显著加速了 AD 进展。更有趣的是,与元队列中的低 RCD.score 组相比,高 RCD.score 组的年龄明显更高(图 6L)。此外,集群中的 RCD.score 和高 RCD.score 患者的数量明显更高。A 患者与集群相比。元队列中的 B 患者(图 6M 和 N)。

SEVEN

高/低 RCD.score 组的免疫景观特征
通过采用 ESTIMATE 算法,研究人员观察到,与低 RCD.score 组相比,高 RCD.score 组表现出更高的免疫评分、基质评分和 estimate 评分。此外,与低 RCD.score 组相比,高 RCD.score 组显示出更高的免疫细胞群(图 7A,补充图 5)。此外,高 RCD.score 组的免疫调节剂高于低 RCD.score 组(图 7C)。高 RCD.score 组的主要途径 (wnt 信号通路,JAK-STAT 信号通路) 活性显著高于低 RCD.score 组 (图 7B,补充图 6)。总之,高 RCD.score 组的患者表现出更大程度的免疫浸润、更高的免疫调节剂和更高的通路活性,这可能是导致 AD 进展的原因。

EIGHT

GWAS 分析
根据 FinnGen 数据库,作者确定了 130 个与 AD 相关的风险基因(图 8A)。GO 和 KEGG 分析显示,这些风险基因主要富集于神经系统发育调节、神经元死亡、突触组织和突触囊泡周期等神经变性通路。值得注意的是,作者发现免疫相关通路,如 Th1 和 Th2 细胞分化以及 Th17 细胞分化显著富集,表明这些免疫可能在 AD 发展中发挥关键作用(图 8B 和 C)。然后,在之前建模的 12 个基因中,有 4 个被认为是 AD 的风险基因(图 9A)。接下来,SMR 表明 4 个基因表达与 AD 发作之间存在显着的因果关系(图 9B-E)。

总结

作者根据 RCD 相关基因确定了两种不同的亚型,每种亚型都表现出不同的标志性通路活性和免疫学景观。具体来说,就是集群。A 患者免疫浸润水平较高,免疫调节剂水平较高,AD 进展不良。利用这些亚型的共享 DEGs 和 WGCNA,作者构建了一个 RCD。分数,在多个数据集中表现出出色的 AD 预测能力。此外,RCD.score 被确定与不良 AD 进展表现出最强的相关性。从机制上讲,作者在高 RCD.score 组中观察到信号通路的激活以及有效的免疫浸润和免疫调节剂,从而导致不良的 AD 进展。