导语

结果:


DEGs 的鉴定
PD 数据共鉴定出 1105 个 DEG,其中 651 个上调,454 个下调。BC 数据中发现 2743 个 DEGs,其中 1067 个上调,1676 个下调。热图(图。1a, b) 显示了这两种疾病的前 30 个 DEG,并且 DEG 在这两种疾病中的表达模式的火山图如图所示。2c 和 d。合并上调和下调的基因,鉴定出 103 个在两种疾病中差异表达的基因(图。2e,f)。

具有可变表达水平的基因的鉴定。(a)PD GSE16134 数据集中前 30 个差异表达基因(DEG)的热图。(b) BC TCGA 数据集中前 30 个 DEG 的热图 (c) PD 数据集 GSE16134 中 DEG 的火山图。(d) BC 省 TCGA 数据集中 DEGs 的火山图。(e)维恩图显示 PD 和 BC 数据之间上调的 DEGs 交集。(f)维恩图显示 PD 和 BC 数据之间下调 DEG 的交集。PD:牙周炎;BC:乳腺癌。

差异表达基因共表达分析。(a) PD GSE16134 数据库的最佳软阈值。(b)BC 的 TCGA 数据集的最优软阈值。(c)PD GSE16134 数据库中基因共表达的聚类树状图。(d)BC 的 TCGA 数据集中共表达基因的聚类树状图。(e)PD GSE16134 数据库中模块-性状关系的热图。(f)BC 的 TCGA 数据集中模块-性状连接的热图。(g)维恩图显示,BC 和 PD 模块中有 147 个基因交集。PD:牙周炎;BC:乳腺癌。
WGCNA 网络建设与模块识别
通过检查样本聚类的异常值并选择合适的切割线阈值,获得了良好的样本聚类。PD 数据集的幂为β = 5,而 BC 的 TCGA 数据集采用β值 6 来确保创建无比例网络(图。2a-b)。用 BC 样本构建的共表达网络包括 19 个模块,而用 PD 样本创建的网络有 5 个模块(图。2c-d)。通过计算与疾病最相关的模块(r)和 P 值获得。在 PD 数据集中,绿松石模量表现出最高的正相关性(r = 0.66),蓝色模量呈最高的负相关性(r = -0.52;图 2e)。在 BC 数据集中,绿色模块表现出最大的显著负相关(r = -0.76),而黄色模块表现出最强的正相关(r = 0.45;图 2f)。通过连接正负相关模块中相关系数最高的基因,共发现 147 个基因(图 2 g)。
共享基因的鉴定和通路富集
使用维恩图(图 9)将 PD 和 BC 中的基因相交,共获得 21 个 PD 和 BC 的串扰基因(TDO2、MARCKSL1、KRT19、SLC7A11、BLM、MMP1、ANKRD29、CYP4F22、ARRDC4、SLC16A7、CD36、CTNNAL1、MAMDC2、CHL1、GNAI1、KAT2B、CTTNBP2、TGFBR3、PLAGL1、GHR 和 EGR3)(图。3a)。对这些基因的功能和途径的评估表明,它们富集了肽激素反应、羧酸转运和有机酸转运(图 3b)。根据 KEGG 数据库,这些基因主要参与生长激素的合成、分泌和作用、雌激素信号通路和趋化因子信号通路(图 3c)。

使用机器学习方法鉴定枢纽基因。(a)维恩图显示了从 WGCNA 中 DEGs 和性状模块关键基因之间的联合集中选择的 21 个基因。(b)共享基因的 GO 分析。(c)共享基因的 KEGG 通路富集分析。(d-e)采用 LASSO 和 RF 算法确定 PD 中的枢纽基因。(f-g)采用 LASSO 和 RF 算法确定 BC 中的枢纽基因。(h)显示 PD 和 BC 共享枢纽基因的维恩图。PD:牙周炎;BC:乳腺癌;DEG:差异表达基因;WGCNA:加权基因共表达网络分析;LASSO:最小绝对收缩和选择算子;RF:随机森林。
枢纽基因的筛选
LASSO 回归和 RF 算法用于查找两种疾病共有的枢纽基因,在 PD 相关数据中分别产生了 14 个和 5 个基因(图 1999 年)。分别为3d 和 e),BC 数据中分别有 15 个和 5 个基因(图。3f 和 g)。通过对两种疾病中通过 LASSO 和 RF 算法获得的交集基因进行交叉,鉴定出两个交集基因(ANKRD29 和 TDO2)(图 3h)。
枢纽基因的表达水平和诊断值
通过构建箱线图显示 PD 和 BC 中两个枢纽基因的表达水平(图。4a, b)。PD 和 BC 患者的 TDO2 表达水平上调,ANKRD29 表达水平下调,与两个外部数据集验证的结果一致(图。4c, d)。诊断标志物的 ROC 曲线显示,ANKRD29(AUC = 0.891)和 TDO2(AUC = 0.887)在 GSE16134 数据集中具有很强的诊断价值(图 4e)。此外,ANKRD29 (AUC = 0.968) 和 TDO2 (AUC = 0.941) 在 TCGA 数据集中表现出几乎优异的 BC 诊断值(图 4f)。这些枢纽基因使用 PD GSE10034 数据集和 BC GSE42568 数据集进行验证;所有这些数据集都显示出很强的预测性能(图。4g,h)。

Sci Rep | 通过整合批量 RNA-seq 和 scRNA-seq 数据鉴定牙周炎和乳腺癌之间潜在的共享基因特征
表达模式的验证以及诊断和预后价值。(a)PD GSE16134 数据库中 ANKRD29 和 TDO2 的表达。(b)BC 的 TCGA 数据集中 ANKRD29 和 TDO2 的表达。(c)PD 验证 GSE10334 数据库中 ANKRD29 和 TDO2 的表达。(d)BC 验证 GSE42568 数据库中的 ANKRD29 和 TDO2 表达。(e)GSE16134 中共享诊断基因的 ROC 曲线。(f)BC 的 TCGA 数据集中共享诊断基因的 ROC 曲线。(g)GSE10334 中共享诊断基因的 ROC 曲线。(h)BC 验证 GSE42568 数据集中共享诊断基因的 ROC 曲线。(i-k)Kaplan-Meier 绘图仪中高-低 ANKRD29 基因表达组之间的 OS、RFS、DMFS。(l-n)Kaplan-Meier 绘图仪中高-低 TDO2 基因表达组之间的 OS、RFS、DMFS。PD:牙周炎;BC:乳腺癌;缺点:控制;OS:总生存期;RFS:无复发生存期。DMFS:无远处转移生存期。*P < 0.05;**P < 0.01;P < 0.001。
候选生物标志物的预后意义
KM 曲线用于探讨这些生物标志物对 BC 的预后意义。根据研究结果,改善的 OS(HR = 0.65,p = 0.0022)、RFS(HR = 0.57,p = 5.1e-13)和 DMFS(HR = 0.72,p = 0.015)与更高的 ANKRD29 水平有关(图 199999 年)。4i-k)。低 TDO2 表达与改善 OS(HR = 1.33,p = 0.0041)、RFS(HR = 1.17,p = 0.0022)和 DMFS(HR = 1.54,p = 8e-08)有关(图 1.08)。4l-n)。这些结果表明 ANKRD29 和 TDO2 对 BC 具有预后意义。
免疫浸润分析
ssGSEA 研究了 28 种免疫细胞在不同样品中的浸润情况。如图所示。5a 和 b(箱线图)、PD 和 BC 与高水平的活化 CD4 T 细胞、活化的 CD8 T 细胞、活化的树突状细胞、未成熟 B 细胞、髓源性抑制细胞 (MDSC)、调节性 T 细胞 (Treg) 和 2 型辅助性 T 细胞 (Th2) 细胞相关。分析免疫细胞候选生物标志物连接,探讨枢纽基因与 28 个免疫细胞之间的关系。TDO2 正向控制 PD 和 BC 样品中的大多数免疫细胞,例如活化的 CD4 T 细胞、Treg 和 MDSC。ANKRD29 与 BC 中的大多数免疫细胞呈正相关,与 PD 中的大多数免疫细胞呈负相关(图 1)。5c, d)。这些发现表明 TDO2 和 ANKRD29 可能控制免疫细胞影响 PD 和 BC 的发展。

分析与 PD 和 BC 相关的免疫浸润。(a)正常和 PD 样本中 28 种免疫细胞分布的箱线图。(b)正常和 BC 样品中 28 种免疫细胞分布的箱线图。(c)PD GSE16134 数据集中枢纽基因与免疫细胞浸润的关系。(d)BC 的 TCGA 数据集中枢纽基因与免疫细胞浸润的关系。PD:牙周炎;BC:乳腺癌;缺点,控制。
枢纽基因的 scRNA-seq 分析
首先,对 RNA-seq 数据GSE164241 和 GSE176078 进行质量控制和数据处理;对于 PD 数据集 GSE164241,细胞表面标记的注释总共产生了 11 种不同的细胞类型,包括内皮细胞,NK/T 细胞,B 细胞,成纤维细胞,浆 B 细胞,血管壁,上皮细胞,髓系细胞,肥大细胞,增殖细胞和黑色素细胞(图 6 a)。图 6b 说明了已知谱系标记在正常组和 PD 组的 11 个主要细胞簇中的表达。基因定位结果显示,ANKRD29 主要位于牙龈组织的成纤维细胞、血管壁和内皮细胞中,PD 样本中 ANKRD29 的表达较正常样本降低。TDO2 主要位于成纤维细胞和血管壁中,PD 样本中 TDO2 的表达高于正常样本(图 6c)。这些结果与批量转录组学结果一致。对于 BC 数据集 GSE176078,细胞表面标记的注释总共产生了 9 种不同的细胞类型,包括 B 细胞,癌症相关成纤维细胞(CAF),癌上皮细胞,内皮细胞,髓系细胞,正常上皮细胞,浆母细胞,血管周围样(PVL)细胞和 T 细胞(图 6 d)。图 6e 说明了 BC 样品中 9 个主要细胞簇中已知谱系标记的表达。 结果表明,TDO2 主要存在于癌上皮细胞、PVL 细胞和 CAF 中,而 ANKRD29 主要存在于 BC 的内皮细胞和 PVL 细胞中(图 6f)。为了进一步探讨枢纽基因在 PD 和 BC 中的作用,根据枢纽基因的表达将枢纽基因主要表达的细胞分为阴性和阳性群体。在 PD 中,ANKRD29+内皮细胞比 ANKRD29-内皮细胞具有更强的输出信号(图 7 a)。与 TDO2-成纤维细胞相比,TDO2 +成纤维细胞具有更强的传入和传出信号(图 7b)。此外,在 BC 中,ANKRD29+ 内皮细胞和 TDO2+癌上皮细胞的传入和传出信号都比其负细胞更强(图。7c-d)。图 7e-h 具体揭示了相关细胞亚群在这两种疾病的细胞通讯中的作用。可以看出,与阴性基因表达相关的亚组相比,阳性基因表达亚群与免疫细胞之间的通讯能力显著增强。上述结果表明,ANKRD29 和 TDO2 可能在 PD 和 BC 的发病机制中发挥重要作用。

PD 和 BC 细胞比例的单细胞分析。(a)UMAP 图可视化了牙龈样本中 11 种细胞类型的分布。(b)热图显示每个细胞群之间具有代表性的 DEG。(c)Con 组和 PD 组 11 个主细胞簇的 ANKRD29 和 TDO2 表达水平。(d)UMAP 图可视化了 BC 中 9 种细胞类型的分布。(e)显示每个细胞群之间代表性 DEG 的热图。(f)BC9 个主要细胞簇中的 ANKRD29 和 TDO2 表达水平。PD:牙周炎;BC:乳腺癌;缺点,控制。

PD 和 BC 中的细胞通讯分析。(a-b)PD 中 ANKRD29 和 TDO2 相关细胞类型传入和传出相互作用强度变化的散点图。(c-d) BC 中 ANKRD29 和 TDO2 相关细胞类型传入和传出相互作用强度变化的散点图。(e)显示细胞充当递质时相互作用ANKRD29-associated密度的 circos 图。(f)显示当 TDO2 相关细胞充当受体时细胞通讯的圆图。(g)显示细胞作为受体时相互作用ANKRD29-associated密度的 Circos 图。(h)Circos 图显示了 TDO2 相关细胞作为受体时的相互作用密度。PD:牙周炎;BC:乳腺癌;缺点,控制。
qPCR 和免疫组化
采用 qPCR 和免疫组化法确认 PD 和 BC 样本中 2 种潜在标志物的表达水平,并验证其诊断价值。qRT-PCR 结果显示,PD 患者中促炎细胞因子(IL-1、IL-6 和 IL-8)的表达高于健康对照者,表明样本采集的可靠性(图。8a)。此外,与健康对照相比,PD 患者的 TDO2 水平较高,ANKRD29 水平较低(图 8b)。同样,BC 患者的 TDO2 mRNA 水平较高,而 ANKRD29 mRNA 水平低于邻近正常组织的 mRNA 水平(图 8c)。基于免疫组织化学,与健康对照 相比,PD 和 BC 样品中 TDO2 表达上调,ANKRD29 表达下调(图 8d)。

PD、BC 和对照组患者中 ANKRD29 和 TDO2 的表达。(a)qRT-PCR 结果显示,健康组和 PD 组牙龈中 IL-1β、IL-6 和 IL-8 的 mRNA 表达水平(分别为 ncon = 7,ncase = 9)。GAPDH 用于相对于对照组的标准化。(b)qRT-PCR 结果显示,健康组和 PD 组个体牙龈中 ANKRD29 和 TDO2 的 mRNA 表达水平分别为 ncon=7,n 例 =9)。GAPDH 用于相对于对照组的标准化。(c)qRT-PCR 结果显示,邻近正常组织和 BC 组织中 ANKRD29 和 TDO2 的 mRNA 表达(ncon = 6,ncase = 6)。GAPDH 用于相对于对照组的标准化。(d)健康组和 PD 组个体牙龈以及 BC 和健康组织中 ANKRD29 和 TDO2 的免疫组化染色。PD:牙周炎;BC:乳腺癌;缺点,控制。

总结

帕金森病中酸代谢和免疫反应失调可能大大增加 BC 的风险。TDO2 和 ANKRD29 是 PD 和 BC 之间的常见生物标志物,可能通过调节免疫反应和肿瘤微环境来共同调节这两种疾病的发病机制。帕金森病的慢性炎症,加上有机酸代谢的改变,创造了一个免疫抑制环境,促进了 BC 省的肿瘤进展。在这两种情况下,TDO2 的上调和 ANKRD29 的下调表明它们共现背后的协同机制。此外,多种 miRNA 已成为各种疾病中基因表达的关键调节因子,具有作为诊断生物标志物和治疗靶点的潜力。靶向调节 TDO2 和 ANKRD29 表达的 miRNA 可以提供新的治疗途径,提供恢复免疫平衡和破坏肿瘤进展的策略。因此,靶向 TDO2、恢复 ANKRD29 表达和探索基于 miRNA 的疗法可能代表管理 PD 和 BC 的有前途的方法,并有可能通过免疫调节和调节肿瘤微环境来改善患者的预后。