导语

结果:
临床队列
发现队列中的血液样本采集自卵巢癌(n = 94)、良性附件肿块(n = 203)或无已知卵巢病变(n = 182)的女性,这些女性曾在荷兰和丹麦医院报告的前瞻性诊断或筛查工作中。在验证队列中,作者分析了宾夕法尼亚大学前瞻性采集或美国商业来源采集的患者样本(n = 40 例卵巢癌患者,n = 50 例良性卵巢肿块患者,n = 22 例无已知卵巢病变)。分析的患者主要代表卵巢癌亚型,包括高等级浆液性(HGSOC)、低级浆液性(LGSOC)、透明细胞癌、黏液性和子宫内膜样卵巢癌,涵盖国际妇产科学联合会(FIGO)所有分期。
对所有参与者,作者分离了血浆,提取了 cfDNA,创建了基因组文库,并以约 2×覆盖率进行了下一代 cfDNA 片段的 WGS。平均每个样本使用 3 毫升血浆,所有样本均顺利处理,未出现样品或技术故障。对于所有患者,作者使用临床级免疫分析测量,从用于基因组分析的同一血液样本或同一患者的血清样本中定量 CA-125 和 HE4 水平。
cfDNA 片段组揭示卵巢癌肿瘤特异性变化
作者评估了 cfDNA 片段化谱,捕捉了 473 个不交集的全基因组 5-Mb 区域的片段大小和覆盖分布,覆盖了 2.4 Gb 的基因组(见图 1;参考文献)。21,22)。 无癌个体的碎片化特征均质,良性附件肿块个体变化有限(见图 2A)。相比之下,癌症患者的碎片化谱在患者间及同一个体基因组不同区域表现出显著异质性,这与影响 cfDNA 断片的染色质景观变化相符(见图 2)。

结合 DELFI 和蛋白质生物标志物的筛查和诊断模型中的卵巢癌检测示意图。个体接受血液采集、血浆提取,并构建基因组文库在低覆盖率(约 2×)下进行 WGS。利用同一收藏中的血液样本,定量蛋白质,从而联合评估全基因组的断片特征和蛋白质生物标志物。这些特征会在机器学习模型中进行评估,用于分类癌症患者和非癌症患者。

Cancer Discov | 利用游离 DNA 片段组和蛋白质生物标志物早期检测卵巢癌
卵巢癌检测中 CFDNA 片段的特征。 一个每条线代表一名参与者,并根据该参与者与无癌女性中位全基因组谱的相关性进行着色。B, 碎片化和蛋白质特征的热图显示,卵巢癌患者中 cfDNA 片段组的异质性与良性病变或无病变者有显著差异。热力图中,个体被划分为疾病组,然后按 DELFI-Pro、CA-125 和 HE4 依次排序,癌症按分期和亚型进行分类。碎片特征以列为群聚。顶部横条表示包含短长片段大小比(比率)和染色体臂表示(z 分数)的特征家族。C, 在 TCGA 评估的卵巢癌肿瘤组织特征性染色体增多(红色)和蓝色缺失(蓝色)在卵巢癌患者中观察到,且在良性病变或无病变患者中缺失(红色代表增色,蓝色表示流失,紫色分别表示染色体表现无变化)。D, 特征重要性通过卵巢癌 PLR 锁定筛查模型的缩放系数衡量,显示 cfDNA 碎片化(片段长度和非整倍体)及蛋白质(CA-125 和 HE4)对高性能有贡献。
卵巢肿瘤以显著的大规模基因组变化而闻名(29–32)。由于 cfDNA 片段组可能反映肿瘤细胞释放的 DNA 片段中包含的大规模基因组变异,作者也考察了这些个体循环中的染色体拷贝数变化。除了全基因组 cfDNA 片段的变化(图 2A 和 B)外,作者还观察到染色体的增减与之前对卵巢肿瘤分析的预期一致,这些均为《癌症基因组图谱》(TCGA;n = 597;参考文献 30)以及早期卵巢癌前体的基因组分析(32),包括 3q、8q、12p、20p 和 20q 的增益,以及 4q、5q、6q、8p、13q、17p 和 22q 的减损(图 2C)。这些增减在无癌或良性附件肿块个体中未被观察到,这与卵巢肿瘤和良性病变可能具有相似解剖位置,但 cfDNA 变化是癌症特异性的观点一致的。
利用 cfDNA 片段组和蛋白质分析检测卵巢癌
鉴于基因组变化与卵巢癌中 CFD 碎片化的一致性,作者采用机器学习方法来确定 cfDNA 片段组的改变是否能区分发现队列中的卵巢癌患者与无卵巢病变者。该模型纳入了全基因组的断片剖析、染色体臂级变化以及蛋白质生物标志物 CA-125 和 HE4 的浓度。作者此前也采用类似方法构建了外部验证的高效肺癌和肝癌检测分类器(21, 22)。这些方法采用了惩罚逻辑回归(PLR),因其模型结构简约、可解释性以及对过拟合的鲁棒性。本研究通过重复 5 重交叉验证确定该分类器的性能,平均每个患者均有 10 次交叉验证重复验证,得出评分[DELFI 蛋白(DELFI-Pro)评分]。DELFI-Pro 分类仪利用片段组特征和蛋白质组测量来检测卵巢癌患者(图 2D)。DELFI-Pro 分类仪采用 PLR 模型,仅保留最具信息量的特征,包括反映染色质和染色体变化的碎片特征,以及传统蛋白质生物标志物。
由于临床特征会影响循环中明显的生物标志物特征,作者考察了 DELFI-Pro 评分与年龄或常见共病(如糖尿病、高血压或动脉粥样硬化)人口统计参数之间的关系,适用于无卵巢疾病且可获得此类信息的人群。作者观察到 DELFI-Pro 评分与这些疾病之间无或关联有限,尽管这一结论受限于临床信息不完整。
随后,作者评估了 DELFI-Pro 评分与卵巢癌的存在和分期之间的关系。交叉验证的 DELFI-Pro 评分涵盖 0 至 1 的范围,针对 182 名无卵巢疾病女性,评分较低,中位数为 0.07。相比之下,卵巢癌女性在所有阶段的中位得分显著较高,包括 I 期= 0.93、II 期= 0.93、III 期=1.00 和 IV 期= 1.00(所有肿瘤阶段的 P< 0.0001,Wilcoxon 秩和检验,图 3A)。得分不因年龄而异(P = 0.95,Pearson 相关系数检验),且在有症状或无症状(P = 0.61,Wilcoxon 签名排名检验)或绝经前后(P = 0.36,Wilcoxon 符号排名检验)的癌症患者中也无差异)。

DELFI-Pro 能够以高灵敏度和特异性检测卵巢癌。 一个在发现队列中,所有阶段的卵巢癌患者在 HGSOC 及其他卵巢亚型中 DELFI-Pro 评分均有所升高。B,ROC 对发现队列的分析显示,跨阶段及 HGSOC 表现均较高。C 和 D, 锁定阈值下的 DELFI-Pro 模型(例如,在 99% 特异性时,DELFI-Pro 得分 >0.66)在验证队列中表现相似。
DELFI-Pro 检测卵巢癌患者时,AUC 为 0.96[95%置信区间(CI)0.93–0.99; 图 3B]。在早期卵巢癌中,表现依然强劲,I 期(n=32)和 II 期(n=26)的 AUC 分别为 0.96(95%置信区间,0.92–0.99)和 0.94(95% CI,0.87–1.00)( 见图 3B)。 晚期[III 期(n = 30)和 IV(n = 2)]卵巢癌患者在被分析个体中检测出高敏感性[AUCs 0.99(95% CI,0.98–1.00)和 1.00(95% CI,1.00–1.00),分别被检测出。交叉验证模型的稳定性分析显示,无论样本收集的折叠或来源如何,非癌细胞的 DELFI-Pro 评分都高度一致()。在 HGSOC(n=39)患者中表现较高,AUC=0.99(95%置信区间,0.99–1.00),以及其他卵巢癌,包括 LGSOC(n=7)、子宫内膜样(n=14)、黏液性(n=12)、透明细胞(n=11)或其他(n=11)亚型[AUCs 为 0.99(95% CI,0.98–1.00)、0.97(95% CI,0.94–1.00), 分别为 0.94(95% CI,0.88–1.00)、0.84(95% CI,0.65–1.00)和 0.96(95% CI,0.87–1.00)]。仅评估无症状个体时也观察到高表现 [AUC 0.99(95% CI,0.97–1)S5A 和 S5B]。其他全基因组分析,如仅包含拷贝数变化的 ichorCNA,以及整体中位 cfDNA 片段长度分析,表现明显较弱,整体 AUC 分别为 0.71(95% CI,0.64–0.78)和 0.59(95% CI,0.52–0.66)。
鉴于卵巢癌发病率极低(美国人口中 10 万名年龄调整女性中有 10.3 人;参考文献33),任何筛查检测都必须具有高特异性,才能给出高阳性预测值(PPV),并最大限度地减少假阳性结果的绝对数量,避免不必要的作或漫长的诊断过程。在特异性>99%下,该环境下 I 至 IV 阶段交叉验证的敏感性分别为 72%、69%、87%和 100%( 见表 2)。HGSOCs 通常在 DELFI-Pro 评分中表现较高,在该阈值检测出 90%(I 至 IV 阶段分别为 83%、88%、91%和 100%)。单独分析 CA-125 在该人群中显著降低,尤其是在相同特异性下,卵巢癌 I–IV 期(P = 0.001,双侧相同比例检测)中检测出的比例显著较低。
除了对欧洲(欧盟)患者发现队列的交叉验证分析外,作者还评估了美国 62 名患者的验证队列中的锁定 DELFI-Pro 分类器。验证队列包括不同卵巢癌亚型患者及无卵巢癌患者。与发现队列的观察类似,验证队列中无卵巢癌女性的碎片化谱在基因组中高度一致,而卵巢癌患者则异质性。美国验证队列患者的 cfDNA 染色体变化与欧盟发现组及 TCGA 卵巢肿瘤组织中观察到的相似。DELFI-Pro 模型在验证队列中检测出高表现(AUC = 0.93,95% CI,0.87–1.00)的癌症患者,包括 HGSOC(AUC = 1.00,95% CI,1.00–1.00)。在确定的分数阈值下,发现队列中为达到>99%特异性,作者整体检测出 73%的卵巢癌和 81%的 HGSOC(图 3C )。这些结果揭示了不同队列间 CFDNA 片段化的共同生物学特征,并证明了 DELFI-Pro 在不同人群中卵巢癌检测中的稳健性和普遍性。
区分卵巢癌与良性肿块
作者考察了作者的方法在诊断环境中是否有助于区分卵巢癌患者与良性附件肿块患者,因为这些患者在临床上难以通过超声预测模型区分。作者观察到,癌症患者与良性病变患者之间的全基因组碎片化谱存在差异(图 2A)。作者在欧盟队列中训练并交叉验证了 DELFI-Pro 机器学习模型,以区分卵巢癌与良性病变。该机器学习模型与筛查场景中开发的模型相似,排名排序的 DELFI-Pro 分数在所有发现队列卵巢癌样本中高度相关(n=94;R = 0.78,P < 2.2e−16)。使用该模型,良性病变患者的中位数得分为 0.17,而癌症患者的 DELFI-Pro 评分则随分期增加。无论病灶大小或患者有症状或无症状,良性病变患者的得分均相似较低。该模型在识别癌症患者方面表现优于良性病变患者,ROC AUC 为 0.88(95% CI,0.83–0.92),范围为 0.82(95% CI,0.74–0.90)至 1.00(95% CI,1.00–1.00),适用于 I 至 IV 期。HGSOC 患者、LGSOC 或子宫内膜样癌症患者较易与良性病变区分[AUC 分别为 0.96(95% CI,0.93–1.00)、0.84(95% CI,0.67–1.00)和 0.91(95% CI,0.85–0.98),而非黏液性或透明细胞亚型[AUC = 0.65(95% CI,0.51–0.79)和 0.77(95% CI,0.62–0.92)]。
在疑似卵巢癌肿块的患者中,临床流程通常涉及转诊至妇科肿瘤科医生进行手术分期。非侵入性检测可以帮助决定转诊、规划手术切除范围,甚至避免年轻或虚弱患者的切除。在这些情形下,高敏感性对于调整反应至关重要,适度特异性可能是可以接受的,因为既要避免漏诊卵巢癌患者,又能避免焦虑和不必要的手术(34)。与此方法一致,在发现队列中,作者在 80%的特异性下,将 95%的 HGSOC 患者与良性肿块患者区分开来。验证队列中锁定模型的评估结果 AUC 为 0.81(95%置信区间,0.72–0.91),在发现队列中达到 80%特异性的评分阈值时,作者保持相对较高的敏感性,81%的 HGSOC 患者被识别出 82%的特异性。在此情境下,DELFI-Pro 评分与整体肿瘤负荷相关,作者观察到 DELFI-Pro 评分与报告病灶直径之和呈正相关(R = 0.65;P = 0.03)。
在人口尺度上模拟 DELFI-PRO 的性能
为了考察 DELFI-Pro 在人群尺度上的卵巢癌筛查表现,作者使用蒙特卡洛模拟评估了理论上的 10 万名女性筛查人群(图 4A)。作者将 DELFI-Pro 与其他两种临床试验进行了比较:CA-125 在 30 U/mL 的阈值和 HE4 在 70 pmol/L 的界限。对于 CA-125 和 HE4,作者均使用文献中报告的性能估计(35, 36)及作者队列中观察到的指标评估截止点,而 DELFI-Pro 则在截止点评估表现,分析中特异性更高。作者根据 UKCTOCS 试验中的分期分布(36)混合了敏感性估计,并基于卵巢癌 0.0037 的患病率(图 4B;参考文献)。33, 37)。基于这些预测概率分布的蒙特卡洛模拟显示,DELFI-Pro 的 PPV 较高(中位数 23.6%,95%置信区间,8.73%–68.5%),而其他所有模态的中位 PPV 估计均为 9.17%或更低(见图 4C)。鉴于卵巢癌的低患病率及探查性手术的风险,需要超过 10%的 PPV 来合理化全人群卵巢癌筛查, 以平衡早期发现益处与健康女性误诊癌症时不必要手术可能带来的危害。 此外,DELFI-Pro 选择的特异性为>99%(发现组和验证队列均无假阳性)的预测低假阳性率(FPR;中位数 0.95%,95%置信区间,0.14%–3.1%),相比其他四种模拟情景(FPR 中位数范围 3.12%–20.60%;图 4D)。这些分析表明,一个易于接近、高度依从性、敏感的,而像 DELFI-Pro 这样的特定检测方法则可能实现全人群卵巢癌筛查。
图 4.
对 DELFI 在卵巢癌筛查中的实施建模。 一个该方法结合了 cfDNA 片段化和抽血蛋白分析。阳性女性将接受阴道超声检查,若阳性,随后进行癌症诊断检查。在该连续体的任何阶段均为阴性,患者将被从后续步骤中移除,并需进行年度筛查。B, 基于 CA-125 和 HE4 的现有表现,以及 DELFI-Pro 的观察结果,模拟了 10 万名女性的理论人群。(C)PPV 和(D)FPR 的预测分布凸显了实施 DELFI-Pro 相较于现有生物标志物的潜在优势。约翰斯霍普金斯大学约翰斯霍普金斯大学;TVUS,阴道超声。

总结

最终,评估生存结果对于证明该方法群体尺度筛查的益处至关重要,因为单靠阶段转移可能无法成为卵巢癌生存的有效替代衡量指标(6, 44)。cfDNA 和蛋白质测量的使用乍看之下可能很复杂,但两种分析物都可以从同一血液样本中评估,优化的方法表明这种结合方法既经济又易于获取。总体而言,本研究提供了一种早期检测卵巢癌的新方法,有望克服当前卵巢癌筛查的挑战,降低该疾病的发病率和死亡率