乳腺癌仍然是全球面临的重大健康挑战,并有显著的分子和临床异质性。过去几十年,对基因组驱动因素的深入了解,推动了治疗方式的进步,包括靶向治疗和免疫治疗。不过,乳腺癌的复发和转移仍然十分常见,这突出了深入了解其生物学机制的必要性。基因组技术最新进展为揭示乳腺癌基因复杂性提供了重要工具,有助于制定个体化治疗方案,从而改善治疗效果。虽然既往研究已取得一些宝贵的成果,但是乳腺癌的分子图谱仍未被完全阐明。传统的靶向测序方法主要集中于已知癌症基因的单个突变,而忽略了靶点之外的重要信息以及其他特征,例如大多数基因组重排、拷贝数变异和突变特征。在此背景之下,全基因组测序作为全面的替代技术,能够捕获基因组变化的全部信息,并提供癌症基因组的全面分析,从而促进生物学发现和潜在生物学标志物的探索,以用于未来的临床应用。过去几十年,学术界主导的癌症基因组研究分析了超过1万个涵盖多种癌症类型的癌症基因组。虽然这些研究已经确定许多基因组突变,但是由于临床记录整合不足,其临床意义往往仍不明确。为了最大限度地发挥基因组测序对临床实践的作用,将基因组数据与治疗效果、疾病复发以及长期临床结局等完整医疗记录整合起来至关重要。

2025年12月3日,全球自然科学三大旗舰期刊之首、英国《自然》正刊在线发表美国Inocras、韩国成均馆大学医学院三星首尔医院、韩国天主教大学医学院首尔圣玛丽医院和富川圣玛丽医院、韩国科学技术院的研究报告,对1364例乳腺癌患者全基因组和转录组测序数据结合临床数据进行全面分析,构建了迄今为止规模最大、最全面的乳腺癌基因组图谱,不仅扩展了已知的驱动基因库,还揭示了基因组不稳定性对肿瘤发生早期的作用,并为精准医疗提供了新的生物标志物。与西方队列相比,该队列患者较年轻且雌激素受体阳性比例较低,为亚洲人群乳腺癌研究提供了独特视角。

该研究队列来自2012至2023年三星首尔医院和首尔圣玛丽医院1364例乳腺癌患者的前瞻和回顾数据,全部样本都进行肿瘤与正常配对全基因组测序,平均覆盖深度40×,并整合大多数病例(88.6%)转录组测序数据,采用标准化流程,确保数据可靠性,从而能够将这些乳腺癌分为五种50基因预测亚型:管腔A型、管腔B型、HER2富集型、基底样型、正常样型,并追踪基因组获得性变异的表达情况。与西方国家的乳腺癌病例相比,该队列的特点是患者较年轻,中位年龄44岁,雌激素受体阳性或管腔A型的比例较低,使其成为独特的研究人群。

该研究利用Inocras全基因组分析平台,对1364例乳腺癌全基因组数据结合其中1209例转录组数据及其患者临床记录进行分析,共定位超过1090万种体细胞突变,为推进精准肿瘤学,尤其对具有独特基因组特征的年轻亚洲乳腺癌人群的研究,奠定了坚实的基础。

全部数据都采用Inocras全基因组肿瘤学解决方案进行处理和分析,临床准确性高,可大规模处理肿瘤与正常样本,能够将原始全基因组测序数据与经过整理的临床记录整合,从而支持高影响力发现所需的精确性和可重复性。

该研究证实一个新概念:结合全基因组测序和真实世界临床数据,无需进行特定临床试验,即可实现数据驱动的生物学标志物发现

该研究的主要发现包括:

  • 全基因组同源重组缺陷特征预测三阴性乳腺癌术后化疗激素受体阳性晚期乳腺癌CDK4/6抑制剂一线治疗效果。

  • 染色体外基因所致HER2扩增与HER2阳性乳腺癌术前化疗良好效果密切相关。

  • 拷贝数扩增(例如MYC、9p23)与生存率低相关。

  • 肿瘤内定量异质性(MATH评分)预测生存结局和抗HER2治疗耐药。

  • 发现罕见但是反复发生的基因融合事件。

关键发现一:驱动基因图谱与新候选基因

  通过IntOGen,确定41种乳腺癌驱动基因,包括TP53、PIK3CA等经典基因,以及4种新候选基因:染色质重塑相关BCL11B、RAS/TGFβ通路RREB1、可能抑癌基因RAF1和SPECCI,这些基因的突变率和功能分析为靶向治疗提供了新靶点。

关键发现二:突变特征与同源重组缺陷

突变特征分析确定17种单核苷酸变异特征、9种插入缺失特征和6种结构变异特征。其中,SBS3、ID6等同源重组缺陷相关特征显著富集于23.1%的病例,尤其基底样乳腺癌达72.2%。同源重组缺陷评分能有效预测三阴性乳腺癌患者术后化疗后的无病生存,发病或死亡风险低90%,突显全基因组测序对同源重组缺陷定量分析的优势。

关键发现三:结构变异与融合基因

  结构变异分析显示,染色体8和11易位(如CCND1、ZNF703和FGFR1)以及HER2位点增强子劫持事件频繁发生,可能通过调控基因表达促进肿瘤进展。复发融合基因如CCDC170与ESR1(内分泌治疗耐药)和BCL2L14与ETV6(侵袭性增强)为治疗耐药机制提供新见解。

关键发现四:拷贝数变异的临床意义

  HER2、CCND1等扩增超过40%由染色体外基因造成。HER2拷贝数≥33能较精确预测术前多西他赛+卡铂+曲妥珠单抗+帕妥珠单抗治疗的病理完全缓解,优于传统免疫组织化学染色,精确度达78.9%。时间分析表明,长片段拷贝数变异在肿瘤诊断前数十年即已发生,提示基因组不稳定性是早期事件。

临床转化:全基因组测序生物学标志物的预后价值

  肿瘤内异质性(MATH评分)与抗HER2治疗的无进展生存相关,MATH≥40时,进展或死亡风险高2.95倍(P=0.002)。激素受体阳性乳腺癌较高的肿瘤突变负荷和同源重组缺陷与CDK4/6抑制剂治疗的无进展生存相关,进展或死亡风险高4.20倍(P<0.001),支持同源重组缺陷作为负面预测因素。

  本研究通过大规模全基因组测序数据,将基因组特征与临床结局深度整合,揭示了乳腺癌异质性的分子基础。局限性包括回顾数据的左截断偏倚,但是通过外部验证(如METABRIC队列)增强了可靠性。将来需要前瞻研究验证这些生物学标志物,以推动全基因组测序进入临床实践,实现真正意义上的个体化治疗。

  该全基因组分析数据集的深度和规模,为乳腺癌研究提供了新的里程碑,能够发现可以直接影响当前患者诊治的生物学标志物。该研究展示了将大规模临床队列与尖端癌症全基因组数据分析相结合所能取得的成果,能够获得靶向测序无法获取的基因组信息,这将加速全基因组测序被用于常规癌症诊疗,这些发现使距离根据患者分子特征进行个体化乳腺癌治疗更近了一步,从而能够做出更明智的决策,最终改善治疗效果。该资源在规模和深度上为乳腺癌基因组学树立了新的标杆,使临床医生和研究人员能够以前所未有的清晰度探索治疗效果、基因组驱动因素和生存结局,该数据集能够成为未来癌症基因组智能平台的重要参考,并应用于诊断、药物研发和个体化治疗等领域。

复旦大学附属肿瘤医院邵志敏教授经常强调:基因组数据唯有与临床紧密结合,方可赋能精准医疗。该研究的发现正体现了这一理念,为乳腺癌的早期干预和靶向治疗策略提供了坚实证据。

  该研究报告就像厚厚的乳腺癌基因天书,记录了1364例亚洲乳腺癌患者的全基因组密码。以往我们谈癌症基因,总像盲人摸象;但是这次,科学家直接给整头大象做了基因扫描,从驱动基因到突变特征,从结构变异到进化时间轴,全部摊开。该研究的核心价值在于:不再只是罗列基因清单,而是把基因组数据与患者的真实治疗结局挂钩,让我们看到基因如何书写命运:

一、驱动基因的新面孔:癌症的肇事者不止TP53和PIK3CA

  如果把癌症比作交通事故,传统认知只盯着TP53、PIK3CA这些老牌肇事司机,但是该研究通过7种算法联合分析,找出41种驱动基因,其中4种为全新发现:BCL11B:如同基因交通警察,负责染色质重塑和乳腺干细胞更新,突变后交通秩序大乱。RREB1:调控RAS和TGFβ信号通路,直接影响p53这个刹车系统。RAF1和SPECC1:疑似抑癌基因,突变后可能加速肿瘤进展。

  启示:癌症的作案团伙远比想象中庞大,未来靶向治疗需要扩大通缉名单。

二、突变特征的时间胶囊:APOBEC和同源重组缺陷如何影响治疗结局

  每个人的癌症基因突变都带有一组条形码,即突变特征。该研究破解了17种单核苷酸变异特征、9种插入缺失特征和6种结构变异特征,其中两个特征尤其关键:

同源重组缺陷:相当于基因修复系统罢工,比例高达23.1%,基底样乳腺癌高达72.2%。同源重组缺陷是双刃剑:三阴性乳腺癌患者同源重组缺陷对术后化疗效果更好,发病或死亡风险低90%;激素受体阳性乳腺癌同源重组缺陷反而导致CDK4/6抑制剂疗效较差,进展或死亡风险高4.20倍。

自然:乳腺癌全基因组研究里程碑

APOBEC缺陷:相当于基因复印机出错,东亚人群携带APOBEC3A/B基因缺失的比例高达31.8%,显著高于欧洲人群8.5%,但是这未必直接导致癌变,而是加剧突变积累。

  启示:突变特征不仅是生物学标志物,更是治疗策略的导航仪,同一特征对不同患者的意义完全不同。

三、结构变异的暗箱操作:基因融合和增强子劫持如何驱动癌症

  结构变异是基因组的乾坤大挪移,该研究发现20万8540个结构变异事件,其中两种典型模式值得深究:染色体8与11的易位:将CCND1、ZNF703和FGFR1基因强行配对,多见于管腔B型乳腺癌,与芳香化抑制剂耐药相关。HER2位点的增强子劫持:染色体17和20的易位把超级增强子绑架到HER2基因附近,导致HER2表达失控,这解释了为何部分HER2免疫组织化学染色阴性肿瘤仍有HER2高表达。

  启示:癌症的狡猾在于暗箱操作,即使基因本身没突变,周围环境的改动也能引爆癌变。

四、拷贝数变异的进化时钟:癌症早在青少年时期就埋下种子

  通过分析拷贝数变异的时间轴,该研究发现:分子时间轴上,大多数长片段扩增(如8q21.13的MYC基因区)在早于诊断前数十年发生,相当于患者在青春期就已携带癌前病变种子。例如,9p23扩增在基底样乳腺癌中预后极差,总死亡风险高2.45倍,且与细胞周期通路激活相关。

  启示:癌症是慢动作事故,早期干预窗口期可能比我们想象得更早。

五、临床转化的试金石:HER2拷贝数比传统免疫组织化学染色更精准

  研究对比了传统免疫组织化学染色与全基因组数据对HER2阳性乳腺癌术前治疗效果的预测能力:

  虽然免疫组织化学染色3+对病理完全缓解的敏感度高达94.7%,但是HER2拷贝数≥33对病理完全缓解的预测精确度达78.9%,假阳性较低。

  染色体碎裂事件更常见于病理完全缓解患者(71.1%比43.2%),提示基因组灾难事件反而可能增强治疗敏感性。

  启示:拷贝数绝对值而非扩增机制(如染色体外基因)才是疗效关键,这颠覆了染色体外基因必然耐药的旧认知。

六、肿瘤异质性的暗流:MATH评分预测耐药风险

  肿瘤内部异质性(MATH评分)像癌细胞的派系斗争,该研究发现:MATH≥40的患者抗HER2治疗时,进展或死亡风险高2.95倍。较高的肿瘤突变负荷和同源重组缺陷同样预示CDK4/6抑制剂治疗不良结局。

  启示:异质性不是抽象概念,而是耐药的根本推手,未来治疗前先测肿瘤内斗指数,或许能避免无效用药。

七、全基因组测序的破局点在哪里?

  该研究的意义堪比从地心说跃迁到日心,让我们看到:癌症基因组是三维的、动态的、与临床结局紧密绑定。知识不是信息堆砌,而是能否帮你做决策,该研究的破局点在于:

  • 从静态基因到动态进化:时间轴分析揭示了癌症的早期起源,呼吁更早的筛查策略。

  • 从单一标记到模式识别:同源重组缺陷、APOBEC等特征需要结合患者个体解读,不能一刀切。

  • 从诊断工具到临床导航:HER2拷贝数、MATH评分等指标已具临床转化潜力。

  未来,全基因组数据如何融入临床?该研究给出了方向:需要标准化、前瞻研究验证,但是无疑已为一人一策的精准医疗铺下基石。正如研究者所言:基因组数据与临床记录的深度融合,才是解锁癌症谜题的钥匙。

Nature. 2025 Dec 3. IF: 48.5

Whole-genome landscapes of 1,364 breast cancers.

Ryul Kim, Jonghan Yu, Joonoh Lim, Brian Baek-Lok Oh, Seok Jin Nam, Seok Won Kim, Jeong Eon Lee, Byung Joo Chae, Ji-Yeon Kim, Ga Eun Park, Bong Joo Kang, Pill Sun Paik, Soo Yeon Bae, Chang Ik Yoon, Young Joo Lee, Dooreh Kim, Kabsoo Shin, Ji Eun Lee, Jun Kang, Ahwon Lee, Erin Connolly-Strong, Sangmoon Lee, Bo Rahm Lee, Yuna Lee, Ki Jong Yi, Young Oh Kwon, In Hwan Chun, Junggil Park, Jihye Kim, Chahyun Choi, Jong Yeon Shin, Hyungjung Lee, Minji Kim, Hansol Park, Ilecheon Jeong, Boram Yi, Won-Chul Lee, Jeong Seok Lee, Woo Chan Park, Sung Hun Kim, Yoon-La Choi, Jeongmin Lee, Young Seok Ju, Yeon Hee Park.

Inocras, San Diego, CA, USA; Samsung Medical Center, Sungkyunkwan University School of Medicine, Seoul, Korea; Seoul St Mary’s Hospital, College of Medicine, The Catholic University of Korea, Seoul, Korea; Bucheon St Mary’s Hospital, College of Medicine, The Catholic University of Korea, Seoul, Korea; Korea Advanced Institute of Science and Technology, Dajeon, Korea.

Breast cancer remains a major global health challenge. Here, to comprehensively characterize its genomic landscape and the clinical significance of genomic characteristics, we analysed whole-genome sequences from 1,364 clinically annotated breast cancers, with transcriptome data available for most cases. Our study expands the repertoire of oncogenic alterations and identifies novel driver genes, recurrent gene fusions, structural variants and copy number alterations. Timing analyses on copy number alterations suggest that genomic instability emerges decades before tumour diagnosis, and offer insights into early initiation of tumorigenesis. Pattern-driven genomic features, including mutational signatures, homologous recombination deficiency, tumour mutational burden and tumour heterogeneity scores, were associated with clinical outcomes, highlighting their potential utility as predictive biomarkers for clinical evaluation of treatments such as CDK4/6 and HER2 inhibitors, as well as adjuvant and neoadjuvant chemotherapy. These findings highlight the power of large-scale, clinically annotated whole-genome sequencing in advancing our understanding of how genomic alterations shape patient outcomes.

DOI: 10.1038/s41586-025-09812-3