在药物研发中实现结构新颖性仍然是一个关键挑战。人工智能已经展现出从海量化学与生物信息中解读分子结构与活性之间复杂关系的巨大潜力。然而,其在探索新颖化学空间方面的能力尚未得到充分研究。

针对上述问题,清华大学黄牛团队于2025年8月18日在《Journal of Chemical Information and Modeling》期刊上发表题为“AI-Designed Molecules in Drug Discovery,Structural Novelty Evaluation,and Implications”的综述文章。该文章评估了近年发表的71个案例中AI设计的活性化合物的结构新颖性。为优化AI驱动的药物研发提供了见解,并强调了跨学科合作的重要性,以平衡结构新颖性与活性。作者建议在AI驱动的药物研发流程中,采用多样化的训练数据集、具备骨架跃迁识别能力的相似性度量方法,以及对相似性筛选谨慎考量。

背景

药物发现是一个复杂、耗时且高成本的过程。人工智能凭借其强大的数据处理与学习能力,通过从海量化学和生物学数据中提取洞见,展现出变革性的潜力。在计算机辅助药物设计中,方法通常分为两类:基于配体和基于结构的模型。基于配体的方法利用配体的结构信息,如分子指纹、描述符、SMILES或分子图。而基于结构的模型则利用蛋白-配体的结构数据预测结合亲和力或生成适配特定结合口袋的配体,从而推动基于结构的药物设计发展。

在AIDD中,药物化学家通常优先关注具有新颖分子骨架的化合物,因为新的化学类型可带来显著优势,如增强效力、改善亚型选择性,以及克服耐药机制。然而,AI生成的临床候选分子往往在结构创新方面表现有限。

为评估AI在发现新型骨架方面的能力,作者分析了近年来报道的AI生成或筛选活性化合物的研究。通过评估代表性案例中化合物的相似性、活性、模型架构和工作流程,识别出AI在药物发现创新中的优势、局限与潜力。

方法

筛选及评估的总体流程如图1所示。从Google Scholar、Web of Science、PubMed和SciFinder中检索了截至2025年3月之前发表的文献。根据以下标准进行筛选:(1)必须采用AI模型作为化合物筛选/设计的核心方法;(2)鉴定得到的苗头化合物需具备实验验证的活性数据;(3)明确记录筛选流程及具有代表性的活性分子。最终得到71个案例研究。在这些研究中,提取了有关方法细节以及结果的重要信息,如靶点名称、模型架构、虚拟筛选流程、实验验证的化合物、生物活性以及表现最佳的代表性分子结构等。

图1 系统性文献综述与AI设计分子结构新颖性评估工作流

在结构新颖性分析中,每项研究选取最多五个最具活性的苗头化合物进行评估。将这些分子与ChEMBL29和CDDI中已有的特定靶点活性分子进行比较。新颖性通过每个hit分子与已知活性分子之间的最大Tanimoto系数(Tcmax)进行量化。Tcmax越接近0,表示结构新颖性越高(差异更大);接近1则表明相似性较强。采用基于Morgan指纹的Tcmax作为主要的新颖性指标。

结果

靶点特征与计算方法

如图2A所示,超过60%的研究集中在酶类靶点上,其中包括激酶(29项研究,涵盖26个独特靶点)和其他酶(17项研究,涵盖15个独特靶点)。其次是核受体、GPCR、转录因子、离子通道,以及表型筛选。在所分析的71项研究中,基于配体的方法占主导地位。相比之下,19项研究使用了基于结构的生成模型,9项研究应用了基于结构的预测模型(图2B)。在19项基于结构的生成研究中,仅有7项明确结合了靶点的结构特征来引导配体生成,而其余12项则依赖于隐式策略,如蛋白-配体相互作用打分或基于序列的条件编码器。

图2 研究中药物靶点与模型分类饼图

在所有研究中获得的苗头化合物,其效力范围从亚微摩尔到微摩尔水平(图3A),其中46项研究实现了低于1μM的活性。然而,单纯的效力并不足以保证临床价值;结构新颖性与衍生化潜力成为进一步优化的关键因素。

图3 最佳hit化合物的效力分布以及各案例hit化合物平均Tcmax值

结构新颖性评估

通过Tcmax的定量评估显示,对新化学空间的探索仍然有限(图3B)。共有30项研究(42.3%)的Tcmax>0.4,表明这些化合物与已知活性分子具有较高的结构相似性;而仅有6项研究(8.4%)实现了Tcmax<0.2。基于配体的方法表现不佳,其中58.1%(25/43)的案例Tcmax超过0.4,而基于结构的方法仅有17.9%(5/28)超过该值。显然,AIDD在探索更大范围的新化学空间方面能力有限,尤其是在基于配体的方法中。这一分布提示大量AI设计的化合物在结构上与现有活性分子高度相似,这可能会因专利性与非靶点效应等问题而限制其治疗潜力。

JCIM|清华大学黄牛等:AI设计的药物分子,结构新颖性评估与启示

新颖性模式

在39项Tcmax<0.4的研究中,观察到三类模式:

(1)未充分研究的靶点。在缺乏或仅有少量已报道活性分子的靶点上,AI模型取得了成功(表1)。例如,Ballarotto等人利用化学语言模型实现Nurr1激动剂的从头设计。Jiang等人开发了一种自回归流模型,从结合口袋中编码上下文条件来生成YTHDC1的配体,而该靶点当时无可用的小分子配体。

表1 针对未充分研究靶点的代表性案例

(2)基于取代的相似性。尽管Tcmax较低,但DDR1和RXR的hit化合物依然通过片段取代与已知活性分子呈现出镜像关系(表2)。在此类情形中,基于指纹的相似性度量未能识别这些骨架层面的重叠,凸显了其在取代识别方面的局限性。

表2 Tcmax较低但仍保有相似骨架的代表性案例

(3)新骨架发现。AI模型成功识别或生成了具备新骨架的命中化合物,重点列举了7个Tcmax<0.4的代表性案例(表3)。常见的配体相似性过滤步骤有助于降低骨架冗余,但往往揭示出与已知活性分子部分子结构的重叠。

表3 利用AI方法获得新hit化合物的代表性研究案例

基于结构的模型与骨架跃迁

虽然基于结构的模型能够识别新骨架,但这些hit化合物往往在与靶点结合位点残基的相互作用上,与已报道配体表现出高度相似性。例如,采用靶点导向方法POEM生成的CDK8抑制剂显示,其最强效的hit分子在激酶铰链区骨架残基上形成典型的氢键,与已知CDK8抑制剂的结合模式相似(图4)。这凸显了骨架跃迁的概念,即不同骨架可以实现相似的结合姿势和与靶点蛋白的关键相互作用。尽管骨架可能是新的,但整体结合模式和关键相互作用仍然保持保守。

图4 (A)POEM设计hit化合物与(B)已报道的CDK8抑制剂的结合模式比较

讨论

在人工智能驱动的药物发现中,生成新的分子骨架至关重要,因为这使得能够识别出具有更高选择性和效力的化合物,并且这些化合物不太可能与现有药物共享耐药机制。然而,仅依赖单一的结构相似性计算方法(如基于指纹的相似性)作为新颖性筛选标准可能并不合适。取代基类型与位置的变化可能降低Tcmax值,从而使结构相似的骨架逃避检测。其他方法,如Bemis-Murcko相似性和拓扑相似性,主要关注整体骨架的相似性,却忽视了局部差异。在新颖性与生物活性之间保持平衡十分关键,因为过于严格的新颖性标准可能限制候选分子的效力。

导致新颖性受限的因素包括:(1)训练数据偏倚:公共数据集更倾向于研究充分的靶点(例如激酶),从而使模型更偏向已知骨架。(2)过拟合与多样性不足:数据集多样性不足及过拟合会妨碍对新化学空间的探索。(3)实际约束:AI算法可能优先生成与已知化合物相似的分子,以兼顾合成可行性、安全性和生物活性。

提升生成分子多样性和新颖性的努力包括:多目标优化,在强化学习中设置针对新颖性和多样性的奖励函数,增强正则化,改进采样方法,以及引入局部骨架多样性贡献生成器。结构驱动的模型因不依赖已知配体而适用于研究不足的靶点。然而,常用的蛋白-配体结合数据集的偏倚限制了此类模型的泛化能力。通过改进算法(例如优化目标函数、采用对抗训练、增强特征学习)可以提升模型在分布外任务中的泛化表现。同时,构建具有更广化学与生物分布的数据集(如BindingNet和CrossDocked)能够改善模型性能。

基于结构的三维生成模型可能因分子数据的噪声敏感性而生成化学上不合理的结构。相较之下,尽管配体驱动的方法在探索新化学空间方面效果较弱,但它们不依赖特定靶点信息,因此在表型筛选等场景下仍然有用。其黑箱特性有时甚至会偶然产出具有新颖生物活性的分子,尽管其骨架探索能力有限。

总结及展望

AI驱动的药物发现已展现出巨大潜力,但目前在分子设计中的结构新颖性仍然有限。基于结构的模型在发现新骨架方面更具潜力,尤其适用于尚未深入研究的靶点;而基于配体的模型由于训练数据的偏倚,往往重复已知骨架。

为推动该领域发展,作者建议:(1)使用多样且平衡的训练数据集以减少偏倚。(2)引入能够识别骨架跃迁的相似性指标,而不仅仅依赖指纹Tc,以更好地捕捉骨架新颖性。(3)在筛选流程中谨慎选择相似性过滤器,以避免结构同质化。(4)构建多目标优化框架,在新颖性、活性与合成可行性之间取得平衡。这些策略将有助于释放AI在探索新化学空间中的全部潜力,加速创新药物的发现。

参考链接:

https:///10.1021/acs.jcim.5c00921