抗体是免疫系统中不可或缺的组成部分,但高亲和力抗体的设计过程依旧耗时且高度依赖实验。为解决这一难题,复旦大学应天雷、上海交通大学赵沛霖、中国科学院大学高兴宇以及腾讯AI Lab姚建华作为通讯作者,联合各自团队,于2025年9月16日在bioRxiv上发表了题为“A Generative Foundation Model for Antibody Design”的研究成果。
该研究提出了一种新型生成式基础模型IgGM,旨在加速高亲和力抗体的工程化设计。IgGM能够学习抗原与抗体之间复杂的结合规律,以及抗体序列与结构之间的映射关系,从而支持多种抗体设计任务。在针对多种抗原的体外实验和计算机模拟基准评估中,IgGM均能稳定地产生具有高实测亲和力的抗体或纳米抗体。研究结果充分展示了IgGM的多样性与高效性,凸显其作为下一代抗体发现与优化强大工具的潜力。
IgGM代码仓库:
https://github.com/TencentAI4S/IgGM
背景
抗体,又称免疫球蛋白(immunoglobulins,Ig),在免疫系统中发挥核心作用,它们识别并结合特定的外源分子(如细菌、病毒、真菌和寄生虫),并标记这些入侵者以便清除。除了免疫功能,抗体在医学、科学研究和生物技术中也有广泛应用,包括疾病治疗、个性化医疗、疫苗研发以及新药发现。其功能的核心机制在于抗体-抗原相互作用,而抗体设计则涵盖了从头设计、亲和力成熟、人源化以及框架区工程等多种情境。传统的抗体生产方法虽然奠定了基础,但仍面临重大挑战。如图1a所示,这些挑战包括生产周期长、批次间差异大,以及需要进行人源化以降低免疫原性,这些限制阻碍了抗体的广泛应用并限制了其治疗效果。
深度学习的发展极大推动了抗体开发中的关键任务。然而,现有方法仍存在一个关键限制,尚无单一框架能够在保持独立于已有抗体结构的同时,全面覆盖多样化的抗体设计任务。尽管大量序列-结构协同设计方法已经验证了AI驱动的抗体设计的可行性,但大多数依赖于已知的抗体-抗原复合物实验结构,或基于已有功能性抗体的改造。当面对没有任何结构先验信息的特定抗原时,这些方法往往无法适用。此外,现有模型通常只专注于单一任务,而不能在多个设计场景中提供统一解决方案。这种功能割裂不仅降低了流程效率,也限制了计算抗体设计在实际治疗开发中的应用价值。
图1 能够设计不同功能区域抗体的多功能生成模型IgGM
为解决上述需求,作者提出IgGM,旨在在单一统一框架下处理多样化抗体设计任务。如图1b、c所示,IgGM采用多阶段架构,首先利用预训练蛋白质语言模型(PPSM)提取抗体的进化序列特征;然后,借助特征编码器(Sgformer)建模抗原与抗体之间的相互作用;最后,使用预测模块同时输出抗体的序列与结构。IgGM显式利用了序列与结构之间的相互作用,即便在输入信息不完整的情况下,也能实现精确设计,这一能力对实际应用至关重要。与以往需要完整结构模板的方法不同,IgGM可以仅基于抗原信息生成具有功能的抗体。具体而言,它能够建模抗体与抗原的相互作用,将设计出的抗体对接到目标表位,并生成关键区域(如CDR)的序列与结构。如图1d总结,IgGM通过整合抗原/表位信息并支持多样化条件输入,展现出卓越的通用性,能够在从头设计、亲和力成熟、框架区工程、人源化以及结构预测等核心任务中一体化应用。同时,它既支持常规抗体,也支持纳米抗体,并允许用户自定义CDR环长。
结果
抗原-抗体复合物结构预测与抗体反向设计
复合物结构预测旨在利用抗原/表位信息和抗体序列作为条件输入,生成抗原-抗体复合物的结构。而反向设计则利用结构信息来生成最优的序列,从而完成设计循环。这两种能力相辅相成,将序列、结构与功能紧密联系在一起,构建出一个全面的抗体工程方法。
图2 IgGM在复合物结构预测与抗体反向设计的性能
如图2a,IgGM在抗体结构预测中表现优于dyMEAN,尽管未使用基于模板的初始化,但仍展现出更优性能。虽然与专用结构预测工具相比仍有差距,但整体结果相当接近,表明IgGM已经学习到抗体结构的分布。在对接性能方面(图2b),IgGM在DockQ指标上超越了结构预测方法与抗体设计方法,显示出较高的对接能力。如图2c所示,IgGM可以精确预测抗原-抗体复合物及纳米抗体-抗原复合物结构。如图2d所示,对于AlphaFold3预测不准确的结构,IgGM还能够修正并生成更合理的结果。
对于反向设计任务,作者实现了一种专门的微调策略,即在训练过程中保持结构固定,仅对序列进行扰动。如图2e所示,输入时仅序列带有噪声,而结构始终保持不变。对比结果显示,IgGM在多个CDR区域的预测准确性均高于ProteinMPNN、ProteinMPNN(Filtered)、IgMPNN与IgDesign(图2f)。这些结果表明,IgGM的设计与优化策略特别适合捕捉这些关键CDR区域的复杂结构与功能特征,从而提升整体的抗体设计效率。
抗体框架区设计

由于框架区(提供结构稳定性)与CDR区(直接介导抗原结合)在结构约束和功能角色上的本质差异,原始的IgGM模型主要在以CDR为中心的任务上进行训练。因此,在应用于框架区设计前,需通过对已知框架区与抗原相互作用的抗体进行微调训练。如图3a所示,通过从SAbDab结构数据库中筛选约2000个抗原-抗体复合物,构建了一个专门的数据集,这些复合物的框架区直接与抗原接触。在微调过程中,特别对与抗原接触的框架区进行扰动,通过在序列和结构上加入高斯噪声,然后训练IgGM在保持整体结构完整性的同时恢复这些被扰动的区域。随后进行了湿实验来验证框架区在Protein A结合以及小鼠抗体人源化方面的有效性。
图3 IgGM在抗体框架区设计的性能
其与Protein A的结合复合物结构如图3b所示。测试了微调是否会对n501-Protein A复合物产生影响。如图3c所示,经过微调后的IgGM成功预测了框架区与Protein A的结合模式,而未经修改的模型则错误地预测为CDR结合模式。通过迭代采样生成了1000个重新设计的抗体,选择了生成频率最高的10个抗体进行湿实验验证。如图3d所示,BLI测试结果表明,其中有2个变体显示出对Protein A的特异性结合(KD值分别为387nM和384nM),而其余8个变体未检测到结合。如图3e所示,测量了抗体在改造前后与原始抗原TNF-α的亲和力变化。实验结果显示免疫亲和力不仅保持稳定,甚至略有提升。这一发现进一步证明了IgGM在抗体框架区设计中的有效性。
为进一步验证IgGM在框架区设计中的能力,对小鼠抗体进行了人源化,以减轻小鼠抗体框架区在人体内可能引发的免疫反应。由图3f可知,在VH-Humanness Score方面,在五个测试序列中,IgGM设计的抗体人源化评分均高于对应的小鼠模板;在结构保持方面,IgGM设计的人源化抗体与小鼠模板的平均CDR3 RMSD明显低于BioPhi,解释了IgGM设计的抗体在结合亲和力上更接近原始小鼠抗体,而优于BioPhi设计的变体。经过湿实验验证,最终获得5个人源化抗体(图3g)。结果表明,IgGM筛选的人源化抗体在保持与小鼠来源抗体相当亲和力的同时,具备更高的人源化程度。
抗体亲和力成熟
作者提出将亲和力成熟视为CDR区域的局部生成任务。在生成过程中,非突变位点保持不变,而突变位点则可以灵活定制,逐步提升抗体的亲和力。对于待优化的抗体,依次重新设计CDR区氨基酸,每个位点生成100个候选抗体,并按生成频率排序,筛选排名靠前的抗体进行湿实验验证。若获得亲和力更高的抗体,则作为输入进入下一轮迭代优化,直至获得目标抗体(图4a)。
第一个案例将该方法应用于提升抗体I7针对人白细胞介素-33的亲和力,这一过程代表了单一靶点的常规亲和力成熟场景。实验结果(图4b-d)表明,结合亲和力显著提升,从原始抗体的52.02nM降低至最佳变体的9.753nM,实现了5.3倍的增强。第二个案例为开发可广泛中和快速突变的病毒靶点(特别是SARS-CoV-2各种变异株)的抗体(图4e),用于检验IgGM是否具备克服抗原免疫逃逸的能力。总体而言,通过两轮迭代,抗体在保持甚至增强对RBD-WT亲和力的同时,实现了对多种变异株亲和力的提升(图4f)。这表明IgGM能够有效应对抗原免疫逃逸并实现广谱活性,进一步验证了上述方法的有效性。
图4 IgGM在抗体亲和力成熟的性能
抗体从头设计
如图5a所示,IgGM支持抗体序列与结构的多步迭代生成。与现有方法需要对已知抗原-抗体复合物施加严格结构约束不同,IgGM可针对没有已知结合伙伴的抗原进行抗体生成。通过指定表位位置,IgGM能够产生精准靶向特定空间位置的抗体(图5b)。此外,IgGM支持对CDR区域长度进行定制化,从而灵活适应特定结构需求。为评估IgGM在临床相关抗体开发中的实际应用潜力,开展了针对PD-L1的全面实验研究。最终选取出现频率排名前60的序列用于湿实验验证。最终,获得了7个高亲和力抗体,且均表现出对PD-L1的特异性结合。
图5 IgGM在抗体从头设计性能
总结
研究展示了在单一模型中统一多种抗体设计任务的可行性,涵盖从头抗体生成、亲和力成熟、框架工程、结构预测以及逆向设计等多个环节。通过实验在多种抗原上验证了IgGM的有效性,包括PD-L1、Protein A、TNF-α、IL-33以及SARS-CoV-2受体结合结构域及其变体。
尽管如此,IgGM仍然存在一定局限性。首先,它依赖于固定的抗原与表位输入,难以捕捉因结合诱导而产生的构象动态,这一不足可以通过引入结构动力学来加以弥补。其次,目前的评估范围仅限于单一抗原,对于更复杂的抗原(如pMHC)上的性能仍有待验证。第三,IgGM仅建模主链原子,而忽略了侧链的显式表征,然而侧链在形成功能性结合位点、驱动疏水堆积以及赋予结合特异性中至关重要。结合类似全原子生成框架的侧链建模,可能为后续改进提供了有前景的方向。
参考链接:
https:///10.1101/2025.09.12.675771