导语

结果:

6+网毒+单细胞+空转+分子对接+实验,干货含量要溢出来了!这套组合拳你怕了吗?

选择大量 RNA-seq、scRNA-seq 和空间转录组数据集
选择了具有详细患者临床特征的批量 RNA-seq 数据集。作者检索了六个公开可用的数据集,即来自 UCSC Xena 数据门户 的 TCGA-LIHC 队列 (n = 355),来自 ICGC 数据门户的 LIRI (n = 202) 和 LICA (n = 152) 队列 
来自 NODE 数据库的 CHCC 队列 (n = 159)和来自 GEO 数据门户 的GSE14520 (n = 221) 和 GSE54235 (n = 78) 队列 。关于 scRNA-seq 数据,选择 GSE149614 队列 (n = 10) 是因为其细胞数量众多且包含各种细胞类型。然后,作者选择了包含恶性和邻近正常组织的 patial 转录组测序数据。
潜在靶点的 PPI 网络和主要靶点的识别
作者通过 TCGA-LIHC 队列的数据确定了 965 个与 HCC 高度相关的靶点。其中,发现了 174 个共同靶点为了进一步分析这些靶点之间的相互作用,作者通过 STRING 数据库构建了一个 PPI 网络,该网络由 174 个节点和 1341 条边组成,平均节点度为 15.4 这 174 个靶标及其关联随后被导入 Cytoscape 中以进一步可视化。进一步确定了 83 个度数≥度中值 (度 = 30) 的目标。此外,还确定了通过 CytoHubba 插件应用四种不同算法(MNC、Degree、EPC 和 Closeness)分析的前 20 个靶点,其中确定了 17 个常见的主要靶点。
鉴定常见的 PFAS 和 HCC 相关靶标以及 PPI 网络分析。维恩图显示了 HCC 中 855 个 PFAS 相关靶标(来自 SwissTargetPrediction 和 CTD 数据库)和 965 个差异表达基因 (DEG)(来自 TCGA-LIHC,n = 355,肿瘤与邻近正常肝组织)之间的交集。使用 DESeq2 和 |log2 FoldChange|> 1 和 FDR < 0.05。B 使用 STRING 数据库构建的 174 个交集目标的 PPI 网络(置信度得分> 0.40;生物体: 智人 )。C Cytoscape(版本 3.10.2)中基于 STRING 的 PPI 网络的可视化,显示了交互复杂性和节点连接性。D 使用 Cytoscape 中的 CytoHubba 插件根据四种排名算法鉴定的前 20 个枢纽基因:MNC、Degree、EPC 和 Closeness
HCC 中 174 种常见 PFAS 相关机制的富集分析
为了研究 HCC 中与 PFAS 相关靶点相关的潜在生物学功能和通路,作者通过 Metascape 进行了功能富集分析。共分析了 174 个常见靶标的 GO 生物过程、分子功能和细胞成分,以及 KEGG 通路富集。结果显示,这些靶点富含羧酸代谢过程、核受体元途径、类固醇代谢过程、肝癌和对外源性刺激的反应等途径(表 1 )。KEGG 结果显示,与代谢(脂肪酸代谢、类固醇代谢)、致癌过程(化学致癌、PPAR 信号传导)和免疫反应(补体和凝血级联反应、IL-17 信号传导)相关的途径显著富集。此外,PPI 网络分析通过 MCODE 算法揭示了 9 个功能模块,突出了参与脂质调节、药物代谢和肿瘤进展的紧密连接的簇。这些发现为 PFAS 暴露导致 HCC 发展和进展的分子机制提供了重要见解。
常见 PFAS 和 HCC 相关靶标的功能富集和 PPI 聚类分析。使用 Metascape 富集 174 个交集 PFAS-HCC 靶标的 KEGG 通路。途径分为新陈代谢、免疫调节和癌症相关过程。使用超几何检验和 Benjamini-Hochberg 校正评估富集显着性 (调整后的 P < 0.05)。使用 MCODE 算法的 B PPI 网络分析确定了 9 个功能模块,富含代谢过程、药物代谢和肿瘤进展。使用 Cytoscape 创建的可视化(版本 3.10.2)
PFASRHSig 生存风险框架的构建和评估
使用 84 个≥ 30 度靶点的表达数据,作者进行了单变量 Cox 回归,揭示了 41 个具有预后价值的基因。然后将这些鉴定出的基因集成到机器学习框架中,以开发一个统一的风险模型,该模型在四个不同的数据集中进行了验证。对于 TCGA-LIHC 队列,作者通过 LOOCV 方法构建了 101 个预测模型,并在所有验证数据集中计算每个模型的 C 指数
使用多队列转录组数据和机器学习构建 PFASRHSig 生存风险模型。 热图显示了六个数据集中 101 个机器学习模型的一致性指数 (C-index):TCGA-LIHC (n = 355)、CHCC (n = 159)、LICA (n = 152)、LIRI (n = 202)、 GSE14520 (n = 221) 和 GSE54236 (n = 78)。B 按平均 C 指数排名前 10 位的预测模型。C 不同 log(λ) 值的弹性网络回归系数剖面。D 使用具有最小偏似然偏差的交叉验证的最优 λ 选择。(E-J)Kaplan-Meier 生存曲线,比较六个队列中的高危组和低危组(中位临界值)。使用 log-rank 检验确定统计显着性
在具有可比 C 指数值的模型中,那些包含较少中心基因的模型是首选。最佳模型将逐步 Cox 回归(正向)与 Enet (α = 0.1) 回归相结合,实现了最高的平均 C 指数 (0.692),同时保留了最少的基因逐步 Cox 回归(正向)保留了所有 41 个预后基因,而 Enet 回归通过最小化部分似然偏差来确定最佳 λ最终,选择了 14 个具有非零 Enet 系数的基因由此产生的风险模型定义如下:风险评分 = exp(−0.0136531033 × ESR1 − 0.0057401447 × APOA1 − 0.0127939803 × IGF1 − 0.0.0601279664 × PPARGC1A + 0.0273195307 × SERPINE1 + 0.0476269799 × HMOX1 − 0.0001355368 × APCS − 0.0629751524 × ACADS − 0.0080130999 × SLC10 A1 − 0.0245156728 × SLC2 A2 − 0.0469738128 × ACAT1 − 0.0089196823 × C1S − 0.0848350866 × LCAT)。
如图 1 所示。4 E-J,在 TCGA-LIHC 训练数据集和五个验证数据集中,被归类为高风险组的患者的 OS 明显低于低风险组 (均 P < 0.001)(图 5 A)。通过 ROC-AUC 分析评估模型的鉴别能力,在 TCGA-LIHC 队列中,1 年、3 年和 5 年生存率的 AUC 值分别为 0.728、0.708 和 0.732;CHCC 队列中分别为 0.824、0.803 和 0.779;在 LICA 队列中分别为 0.802、0.767 和 0.747;在 LIRI 队列中分别为 0.755、0.812 和 0.834; GSE14520 队列中分别为 0.721、0.717 和 0.725;和 GSE54236 数据集中分别为 0.916、0.907 和 0.902。
评估 PFASRHSig 的预测性能。TCGA-LIHC 队列中的风险评分分布。临界点设置为 − 1.66953,即风险评分中位数。热图显示了模型基因在高低 PFASRHSig 组的不同表达水平。(B-G)评估六个队列的 1 年、3 年和 5 年生存预测的时间依赖性 ROC 曲线:CHCC (n = 159)-AUC:0.824、0.803、0.779;LICA (n = 152)-AUC:0.802、0.767、0.747;LIRI (n = 202)-AUC:0.755、0.812、0.834;TCGA-LIHC (n = 355)-AUC:0.728、0.708、0.732; GSE14520 (n = 221)-AUC:0.721、0.717、0.725; GSE54236 (n = 78)-AUC:0.916、0.907、0.902
通过 scRNA-seq 数据绘制的 HCC 细胞景观
应用 Harmony 算法后,每个样品内的细胞分布基本保持一致,表明样品之间没有明显的批次效应,使其适合下游分析使用 0.4 的分辨率参数共鉴定了 17 个不同的细胞簇作者重新分析了跨越 13 个样本的 71,915 个 scRNA-seq 细胞,包括原发性肿瘤、淋巴结组织和门静脉癌栓 (PVTTs)。在经典标记基因的基础上,作者成功地对各种细胞群进行了分类,包括 T/NK 细胞、B 细胞、浆细胞、恶性细胞、单核细胞、巨噬细胞、成纤维细胞、周细胞、内皮细胞和循环细胞. 对应于每种细胞类型的标记基因显示出不同的表达模式,增强了作者细胞注释的准确性。
来自 scRNA-seq 分析的 HCC 细胞景观。(A) 使用 Harmony 算法对 13 个 scRNA-seq 样本 (GSE149614 ) 进行批量校正整合的 UMAP 图,包括 10 名 HCC 患者。B 使用 Seurat R 软件包将 71,915 个高质量细胞聚类成 17 个不同的聚类(分辨率 = 0.4)。C 基于经典标志物的细胞类型注释:T/NK 细胞、B 细胞、浆细胞、恶性细胞、巨噬细胞、单核细胞、成纤维细胞、内皮细胞、周细胞和循环细胞。D 点图显示了用于注释不同簇中细胞类型的经典标记基因的表达模式。E UMAP 图可视化关键标记基因的表达模式
HCC 生态系统中核心靶标的表达谱
从 PFASRHSig 生存风险框架中鉴定的 41 个预后基因靶标与通过 CytoHubba 插件鉴定的 17 个常见主要靶标交集,从而确定了 6 个核心靶标以供进一步分析。所有 6 个核心靶标在正常组织中的表达水平均显著高于肿瘤组织。值得注意的是,APOA1 在肿瘤组织和正常组织中都很丰富,突出了它在细胞生物学中的关键作用单细胞景观分析显示 HCC 生态系统内所有细胞类型的 ESR1 表达都较低,而 APOA1、PPARGC1A、SERPINE1 和 PON1 主要在恶性细胞中表达。在所有细胞类型中,巨噬细胞的 IGF1 浓度最高
六个核心 PFAS-HCC 靶基因的表达和空间分布。A-L 箱形图和 UMAP 可视化显示肿瘤与邻近正常组织中 ESR1、APOA1、IGF1、PPARGC1A、SERPINE1 和 PON1 的差异表达。 通过未配对的 t 检验评估统计显着性。(M-R)来自空间转录组学的细胞类型注释图,显示恶性细胞、肝细胞、巨噬细胞、CAF、B 细胞和 CD8 + T 细胞的分布。S-X ESR1、APOA1、IGF1、PPARGC1A、SERPINE1 和 PON1 的空间基因表达图谱。*P < 0.05; **P < 0.01; ***P < 0.001
作者通过空间转录组学进一步研究了这 6 个核心基因的表达谱。对 HCC 微环境中的各种细胞类型,包括恶性细胞、肝细胞和几种类型的基质细胞进行了注释。ESR1 在正常肝细胞中的表达略高于恶性细胞,在基质细胞中观察到的表达水平相对较低相比之下,APOA1 在正常组织和基质组织中的表达明显高于恶性组织 IGF1、PPARGC1A、SERPINE1 和 PON1 表现出相似的分布模式。
通过 RT-qPCR 和 IHC 验证靶基因表达
为了验证计算机中鉴定的 6 个核心基因的表达模式,作者对肿瘤和正常组织样本进行了 RT-qPCR 和 IHC 染色。RT-qPCR 分析显示,与癌旁正常组织相比ESR1 、 APOA1 、 IGF1 、 IGF1 、 PPARGC1A 、 SERPINE1 和 PON1 的表达显著降低 (P < 0.05) (图 8 A)。与这些发现一致,六个核心靶标的 IHC 染色结果在蛋白质水平上显示出相似的趋势在正常组织中观察到 ESR1 、 APOA1 、 IGF1 和 PON1 的强免疫反应性,而在肿瘤组织中观察到弱染色或无染色。SERPINE1 在肿瘤和正常组织中显示出相似的染色强度。
通过 RT-qPCR 和 IHC 对基因表达进行实验验证。 对 6 名 HCC 患者配对肿瘤和邻近正常组织中基因表达 (ESR1、APOA1、IGF1、PPARGC1A、SERPINE1 和 PON1) 的 RT-qPCR 定量。数据以 SD ±平均值表示;通过配对 t 检验确定显着性 (P < 0.05)。B 显示蛋白质表达模式的 IHC 图像(来源于人类蛋白质图谱)。在正常组织中呈强染色,在肿瘤组织中 ESR1 、 APOA1 、 IGF1 和 PON1 染色减少或不存在。SERPINE1 在两种组织类型中显示出相似的染色。PPARGC1A IHC 数据不可用。*P < 0.05; **P < 0.01; ***P < 0.001; ****P < 0.0001
PFOA 和 PFOS 与 HCC 的 6 种核心靶蛋白的分子对接
通过 AutoDock 和 AutoDock Vina 工具获得的对接结果显示,PFOA、PFOS 和 6 种靶蛋白之间具有很强的亲和力(表 2 )。这些发现表明结合是自发的,并突出了这些蛋白在 HCC 中 PFOA 和 PFOS 机制中的关键作用。PFOA、PFOS 和六种核心靶蛋白之间的相互作用被可视化
PFAS 与 6 种核心 HCC 靶蛋白的分子对接结果。A-F PFOA 和 PFOS 与 APOA1、ESR1、IGF1、PON1、PPARGC1A 和 SERPINE1 之间的对接相互作用的可视化。 使用 AutoDock Vina 进行对接。结合能值范围为 − 5.3 至 − 7.6 kcal/mol,表明自发结合。相互作用类型包括范德华力、氢键、卤素相互作用和烷基接触。


总结

本研究整合了多组学和计算毒理学,以探索 PFAS 暴露在 HCC 中的作用。作者确定了 6 个关键靶基因 (APOA1 、 ESR1 、 IGF1 、 PPARGC1A 、 SERPINE1 和 PON1),并强调了参与 PFAS 诱导的肝癌发生 的代谢、免疫和致癌途径。作者的 PFASRHSig 风险模型显示患者生存率高,分子对接证实了 PFAS-蛋白质的强烈相互作用。虽然这些发现增加了对 PFAS 毒性的理解,但还需要进一步的实验验证和真实世界暴露研究。本研究提供了新的生物标志物、风险评估工具和潜在的治疗靶点,强调了迫切需要制定监管政策来减轻 PFAS 相关的健康风险。