导语

传统的不对称合成方法开发很大程度上依赖于化学经验,人工智能(AI)与高通量实验(HTE)技术的有机结合,为发现和优化不对称反应提供了一种新的模式,具有革新这一领域的巨大潜力。广州国家实验室廖矿标课题组近期开发了一套高效的工作流程,利用AI和HTE技术开发了一系列镍催化的不对称交叉偶联反应,以高产率和高对映选择性地构建了一系列手性sp3碳碳键。相关研究成果在线发表于ACS Catal.(DOI: 10.1021/acscatal.4c04277)。


前沿科研成果

天然丰富的sp3碳立体中心在多种天然产物、药物和材料中普遍存在。因此,开发能够同时构建sp3碳中心和控制立体化学的方法至关重要,尽管这一过程充满挑战。在过去的二十年中,过渡金属催化的不对称交叉偶联反应取得了显著进展,特别是镍催化剂因其独特的催化活性而受到广泛关注。目前已经开发出多种用于构建手性sp3碳杂化中心的高效方法,如镍催化的不对称交叉偶联和亲电交叉偶联、镍/光氧化还原催化的不对称偶联,以及镍氢化物催化的烯烃不对称氢碳化反应等(图1a)。这些转化通常在偶联产物生成之前经历共同的Ni(III)中间体,这个关键的中间体是含有手性配体和偶联片段的Ni(III)复合物,通过手性配体和底物片段共同创造了一个特定的手性环境,从而决定了偶联产物的对映选择性(图1a)。镍催化剂常用含氮配体,如恶唑啉配体(例如Box, Biox, Pyox, Pybox)、咪唑啉配体和手性二胺配体等(图1b)。作者认为可能存在一个普遍适用的规则控制着镍催化偶联反应的对映选择性,这一规则可以通过AI阐明,并帮助化学家开发新的不对称反应。基于这一机理见解,作者开发了一个简明的AI预测模型,阐明了控制镍催化不对称偶联反应对映选择性的一般规则,利用AI辅助的手性配体筛选和HTE辅助的条件优化,成功地开发了多种类型的镍催化不对称交叉偶联反应(图1c)。

图1(来源:ACS Catal.

作者收集了2023年之前发表的117篇文献中记录的4219个镍催化的不对称反应数据,并通过高通量实验平台获得了2371个镍催化不对称交叉偶联的实验数据,共同建立了包含6590条数据的数据集,使用基于机器学习的预测模型来确定手性配体对偶联产物的影响。由文献数据可知,镍催化的不对称交叉偶联反应中控制产物对映选择性的关键因素是手性配体,因此作者仅以关键的手性配体、手性产物以及反应温度参数作为模型输入,过渡态自由能差ΔΔG作为输出,利用课题组开发的分子加和性指纹(MAF)作为分子描述符,利用亚马逊公司开发的自动机器学习平台AutoGluon进行建模,经过优化后得到了一个良好的预测模型,其R2为0.880,平均绝对误差(MAE)为0.173 kcal/mol

作者使用2023年之后报道的镍催化不对称交叉偶联反应数据作为实际外部验证集,以验证AutoGluon模型的性能。如表2所示,文献中的实验ee值与模型预测ee值之间的绝对误差大部分在10%以内,甚至有些误差在5%以内。此外,这些文献中的最优配体大多数在模型预测的配体排名的前10位(表1)。也就是说,机器学习模型可以应用于手性配体的虚拟优化,只需要进行少量尝试即可获得最优配体。
表1(来源:ACS Catal.

作者继续尝试将模型应用于新的镍催化不对称反应的发现和优化过程。该模型不仅可以应用于对已知反应的进一步开发与优化(图2a, b),还可以基于高通量实验发现的一系列新反应快速进行不对称偶联反应手性配体的开发(图2c, d)。作者将HTE实验随机选择的47个手性配体、AI预测的最优Top 5手性配体、基于人工经验挑选的数据库中的高频出现的Top 7手性配体以及平均结果最优的Top 7手性配体,对这些新发现的偶联反应进行了实验验证,实验结果表明,AI预测的最优配体表现明显优于随机筛选的配体,以及基于人工经验挑选的手性配体(图2e)。充分证明了模型能够高效地进行手性配体的虚拟筛选,并最大限度地减少随机的筛选工作。
图2(来源:ACS Catal.

广州实验室廖矿标课题组ACS Catal.:基于人工智能与高通量实验技术开发镍催化的不对称交叉偶联反应

然后作者利用AI预测的最优配体针对典型的交叉偶联反应反应条件进行了高通量实验筛选,通过结合AI辅助的手性配体筛选和HTE辅助的条件优化,快速开发了一系列镍催化不对称交叉偶联反应,并对其中一种类型的不对称交叉偶联反应进行了底物普适性考察,以良好的收率和ee值得到了一系列含氮手性化合物(图3)。
图3(来源:ACS Catal.
作者提出了一个结合高通量实验(HTE)和人工智能(AI)的高效工作流程,用于开发新型的镍催化不对称交叉偶联反应。基于分子加和性指纹(MAF)描述符的AutoGluon模型被用来指导手性配体的高效筛选,而HTE则被用作反应参数优化的强大工具。基于反应机理,特别是关键的Ni(III)中间体的理解,准确建立了反应对映选择性的回归模型。这个机器学习模型不仅能够准确预测最近文献中报道的最优配体,而且可以应用于新的镍催化不对称交叉偶联反应的手性配体优化,从而成功合成了一系列具有良好产率和对映选择性的手性sp3碳碳键。这种创新的工作流程将作为不对称方法开发的一个新模式,并激励研究人员进一步探索HTE和AI在这一领域的发展潜力。

该工作近期发表在ACS Catal.,论文第一作者是广州国家实验室博士后高亚东以及中山大学联合培养2023级博士研究生胡坤军廖矿标研究员为该论文的通讯作者。广州国家实验室饶建行、中国科学院广州生物医药与健康研究院朱强研究员参与了该工作。上述研究工作得到了国家自然科学基金((22071249和 22393892)的资助。

课题组简介

课题组长期致力于利用自动化、高通量、人工智能等现代化学技术,开发新型合成方法学,建立人工智能反应预测模型,聚焦呼吸系统疾病开展新药研发。具体的研究方向包括:1. 合成方法学:围绕惰性化学键(碳氢键、碳碳键等)精准转化开发方法学;2. 反应预测模型:利用自动化高通量技术,收集标准化的反应数据,建立人工智能反应预测模型,实现合成路径、反应条件或反应结果的精准预测,目前在研项目包括惰性碳氢、碳碳键活化、不对称催化、光催化等类型的反应或反应体系;3. 呼吸系统疾病新药研发:开发新型化合物库合成以及活性筛选工具,研发抗冠状病毒的小分子药物。


作者简介

通讯作者

廖矿标,广州实验室研究员,博士生导师,国家高层次青年人才,广东青年五四奖章获得者。课题组长期致力于利用自动化、高通量、人工智能等现代化学技术,开发新型合成方法学,建立人工智能反应预测模型,聚焦呼吸系统疾病开展新药研发。具体的研究方向包括:1. 合成方法学:围绕惰性化学键精准转化开发方法学;2. 反应预测模型:利用自动化高通量技术,收集标准化的反应数据,建立人工智能反应预测模型,实现合成路径、反应条件或反应结果的精准预测;3. 呼吸系统疾病新药研发:开发新型化合物库合成以及活性筛选工具,研发抗冠状病毒的小分子药物。至今,已以通讯作者或第一作者在Nature(2篇)、Nat. Chem.ChemAngew. Chem.Sci. China Chem.ACS Catal.等期刊发表系列论文。

第一作者

高亚东博士,2020年毕业于南京理工大学与北京生命科学研究所,随后在广州国家实验室廖矿标课题组进行博士后研究,现为中国医学科学院药物研究所助理研究员。以第一作者在Chem, Angew. Chem. Int. Ed., ACS Catal., Org. Chem. Front.等期刊发表系列论文。
胡坤军,2019~2022于上海师范大学与中科院上海有机所进行官方联合培养,2022年获得有机化学硕士学位,随后在广州国家实验室廖矿标课题组工作并于2023年转为中山大学同广州国家实验室联合培养博士研究生。以第一作者在ACS Catal., Organometallics等期刊发表研究论文。

论文信息

Artificial Intelligence-Driven Development of Nickel-Catalyzed Enantioselective Cross-Coupling Reactions

Yadong Gao,# Kunjun Hu,# Jianhang Rao, Qiang Zhu, Kuangbiao Liao*

ACS Catal. 2024, DOI: 10.1021/acscatal.4c04277