在这项研究中,作者从 PubChem 数据库中检索了黄曲霉毒素 B1 的标准化学结构( 图 2 A)及其分子。作者最初从 ChEMBL、STITCH 和 SwissTargetPrediction 数据库中筛选了 181 个 AFB1 相关靶点。随后,对 TCGA-STAD 数据集进行差异表达分析,鉴定出 12,727 个与胃癌高度相关的靶点。维恩图分析揭示了这两个基因集之间有 55 个交集的靶点,这些靶点被指定为 AFB1 诱导的胃癌发生的潜在靶点( 图 2B)。
图 2.(A) AFB1 的化学结构来自国家生物技术信息中心 (NCBI)(检索于 2025 年 5 月 11 日)。(B)维恩图说明了 AFB1 靶标和胃癌相关靶标之间的交集。
通过将血液表达数量性状位点(eQTL)数据与全基因组关联研究(GWAS)汇总统计(GCST90018849)相结合,本研究采用基于汇总数据的孟德尔随机化(SMR)结合依赖仪器异质性(HEIDI)测试。作者鉴定出 609 个达到显著性阈值的基因( 图 3A),定义为 SMR p < 0.05 和 HEIDI p ≥ 0.05。这些结果表明这些基因的表达水平与目标表型之间存在潜在的因果关系,没有观察到遗传异质性的显着证据。
图 3.筛选核心靶点。(A)用于筛选 MR 分析结果的散点图。橙色基因是满足要求的基因。(B)MR 筛选获得的基因与 AFB1-STAD 基因交集的维恩图,框中有五个交集靶标。
通过孟德尔随机化鉴定的胃癌相关基因与上述 55 个潜在靶点之间的交叉分析揭示了五个核心靶点:MAPK3、CCNE1、CA14、CCNE2 和 LRRK2( 图 3B)。
作者使用 clusterProfiler 包对 AFB1 和胃癌之间的交集靶标进行了基因本体(GO) 富集分析。分析产生了 237 个具有统计学意义的 GO 项,包括 181 个生物过程 (BP)、5 个细胞成分 (CC) 和 51 个分子功能 (MF)。术语按错误发现率(FDR)进行排名,并在富集图中可视化每个类别中 FDR 最低的前 5 个术语。条形图显示,显着富集的途径集中在细胞周期调节和环核苷酸代谢中( 图 4A)。这些发现表明,AFB1 可能通过破坏细胞周期检查点和环核苷酸信号传导失调,协同促进胃癌细胞的异常增殖和基因组不稳定性,可能涉及有缺陷的 DNA 损伤反应和异常的表观遗传修饰。这一发现为阐明 AFB1 的致癌机制提供了潜在的通路靶点,保证了 AFB1 暴露下关键基因的进一步功能验证。
图 4.富集分析。(A)GO 富集分析的条形图由 BP、CC 和 MF 三部分组成。(B)KEGG 富集分析的棒棒糖图,圆圈内的数字代表该途径中富集的基因数量。(C)五个核心靶点所在的 KEGG 通路,蓝色表示基因存在,灰色表示不存在。
对交集靶标的 KEGG 通路分析确定了 21 条富集通路,使用分类棒棒糖图进行可视化( 图 4B)。将五个核心靶点(MAPK3、CCNE1、CCNE2、CA14、LRRK2)定位到其相关的 KEGG 通路( 图 4C),蓝色表示基因存在(标记为 1),灰色表示不存在(标记为 0)。CCNE1 和 CCNE2 作为 G1/S 相变的核心调节因子,可能与 MAPK3 合作驱动 PI3K-Akt 信号通路介导的异常细胞增殖(Fruman et al., 2017),同时抑制 p53 依赖性衰老以促进永生化。这些基因在乙型肝炎和人类 T 细胞白血病病毒致癌途径中共富集,暗示病毒感染可能通过上调 CCNE1/CCNE2 表达和 MAPK3 磷酸化来劫持宿主细胞周期检查点,从而诱导基因组不稳定性。这种共富集模式突出了 CCNE1/CCNE2 和 MAPK3 作为多维致癌中心,整合了失调的细胞周期控制、病毒诱导的炎症应激和表观遗传改变,共同推动肿瘤发生。
进行分子对接,研究 AFB1 与 5 种核心靶蛋白(MAPK3、CCNE1、CA14、CCNE2 和 LRRK2)之间的相互作用。使用 CB-Dock2 平台,生成了五个对接位姿。其中,MAPK3 表现出最低的 Vina 评分(-8.9 kcal/mol),表明与 AFB1 的结合亲和力最强( 图 5A-B)。其他靶点的 Vina 评分为:LRRK2(-8.6 kcal/mol)、CCNE2(-8.3 kcal/mol)、CA14(-8.1 kcal/mol)和 CCNE1(-7.9 kcal/mol)。
图 5.核心基因与 AFB1 的分子对接分析.(A)五个核心目标对应的结合能大小,数字表示相应的结合能。(B)具有最高组合能量的 MAPK3 组合示意图。
Vina 分数表示配体 (AFB1) 与其蛋白质靶标之间的结合能,使用 AutoDock Vina 算法计算。该分数通过线性回归模型与实验测量的结合自由能 (ΔG) 相关联:ΔG ≈ Vina Score × α + β,其中α(缩放因子)和β(截距)源自训练数据集,以使计算预测与实验值保持一致。较低(更负)的 Vina 分数表明配体-蛋白质结合稳定性更强。值得注意的是,所有五个核心靶标都表现出与 AFB1 的稳健结合相互作用。
线粒体基因含量超过 25%的细胞被排除在外( 图 6A)。过滤后,在单个细胞中检测到的 RNA 分子数量与唯一分子标识符(UMI)之间存在很强的正相关关系(R = 0.93)( 图 6B)。使用和谐包对批量效应进行校正,并在校正后对集成数据集进行可视化( 图 6C)。对排名前 2000 的高度变异基因 (HVG) 进行了 PCA 分析。由于前 11 个主成分(PC)的标准差迅速下降并随后趋于稳定,因此保留了 11 个 PC 用于下游分析( 图 6D)。以 1.5 的分辨率聚类( 图 6E)并用 SingleR 包注释确定了主要细胞群:NK 细胞,单核细胞,T 细胞,B 细胞和中性粒细胞( 图 7A)。
图 6.单细胞数据处理和质量控制。(A)单细胞数据的质量控制。(B)单细胞数据分子数量与基因数量的相关性极高,达到 0.93。(C)前 11 个主成分的标准差迅速下降,第 11 个主成分后趋于平缓。因此,保留了 11 个主成分以供后续分析。(D)前 11 个主成分的标准差迅速下降,11 个主成分后趋于平缓。因此,保留了 11 个主成分以供后续分析。(E) 选择 1.5 的分辨率进行聚类分析。
图 7.核心基因的单细胞表达谱和细胞间通讯。(A)单细胞数据聚类结果图显示,共获得 5 个细胞聚类。(B)核心基因的表达状态,气泡大小表示表达量,颜色深度表示平均表达水平。(C)核心基因表达的 TSNE 图,红色表示表达。(D)五类细胞之间的通信条件。(E)细胞通讯热图:颜色越红,通讯越强。
表达分析表明,MAPK3、CCNE1、CCNE2 和 CA14 在 T 细胞中平均表达量最高,而 LRRK2 主要在中性粒细胞中表达( 图 7B-C)。机制上:MAPK3 是 MAPK 信号通路的关键介质,调节 T 细胞受体信号传导、增殖、分化和存活。CCNE1 和 CCNE2 是驱动 G1/S 相变的细胞周期蛋白,可促进 DNA 复制和细胞分裂,表明 T 细胞活跃增殖。LRRK2 参与炎症反应、自噬和溶酶体功能,可能通过其在中性粒细胞中的富集来反映持续的炎症。细胞间通讯分析突出显示 B 细胞是 NK 细胞的活性信号发送者,而单核细胞显示出强大的自分泌信号传导( 图 7D-E)。
通过空间热图,作者确定了样品中的空间异质性( 图 8A)。聚类分析揭示了具有相似剖面的空间聚集点( 图 8B)。通过将单细胞测序注释的细胞类型映射到空间切片上( 图 8C),作者观察到 T 细胞主要位于两个区域:左上核心和右下边缘。空间基因表达热图显示出互补的模式:CCNE1 和 CCNE2 在左上 T 细胞中表达较高;MAPK3 在右下 T 细胞中表达升高。作者假设左上角区域的 Treg 建立增殖-免疫抑制轴以保护肿瘤核心。为了验证这一点,作者可视化了 Treg 特征基因:FOXM1 和 FOXP3 在该区域显示出更高的表达( 图 8D-J)。这证实了左上角区域是一个增殖的 Treg 生态位,其中细胞周期激活(例如,G1 / S 过渡)维持克隆扩增以形成免疫抑制屏障。
图 8.空间转录组学和单细胞 RNA 测序的综合分析。(一)测序深度热图。(B)空间转录组学的聚类结果。共有 13 个星团,并显示了它们在空间中的分布。(三)映射的单细胞注释结果的热图。(D-J)相关基因的空间表达模式。
比较 TCGA 队列中正常(蓝色)和肿瘤(红色)样本之间五个核心基因(MAPK3、CCNE1、CA14、CCNE2 和 LRRK2)表达水平的箱线图显示,胃癌中 MAPK3、CCNE1、CCNE2 和 LRRK2 的表达存在统计学上的显着差异( 图 9A)。免疫组化结果也证实了这一点。肿瘤样本中 MAPK3、CCNE1 和 CCNE2 的蛋白表达 leve006Cs 较高,而 CA14 无显著差异。LRRK2 的蛋白表达在正常样品中较高( 图 9B)。Kaplan-Meier (KM) 生存曲线显示,四个基因(MAPK3、CCNE1、CA14 和 CCNE2)与患者预后显着相关,但 LRRK2 没有。具体而言,CCNE2 是生存结局不良的保护因素(风险比,HR < 1),而 MAPK3、CCNE1 和 CA14 是生存结局不良的危险因素(HR > 1)( 图 9C)。
图 9.核心靶点的表达分析和生存谱。(A)肿瘤与正常组织中五个核心靶点的表达水平。(B)肝癌和正常肝组织中 5 种核心蛋白的蛋白表达水平,颜色越深,蛋白表达越强。(C)5 个核心靶点的 KM 生存曲线及胃癌患者预后。
总结
这项多组学研究揭示了 AFB1 在胃癌中的非遗传毒性机制,确定了 MAPK3、CCNE1/CCNE2、CA14 和 LRRK2 作为驱动细胞周期失调、PI3K-Akt 过度激活和免疫微环境破坏的核心靶点。分子对接证实了 AFB1-MAPK3 的强结合 (-8.9 kcal/mol),而单细胞分析显示 T 细胞和中性粒细胞中靶标富集,将毒素暴露与免疫逃逸和炎症联系起来。MAPK3-FOXM1-细胞周期蛋白 E 轴进一步解释了 AFB1 诱导的复制应激和基因组不稳定性。尽管有计算方面的见解,但仍需要进行实验验证。这项工作建立了研究环境致癌物的范式,为预防气候加剧的食品污染和政策策略提供了生物标志物。
|