CRISPR基因编辑技术的过去、现在与未来

摘要

基因组编辑已成为生命科学和人类医学领域的变革性力量,为解析复杂生物学过程以及治疗多种遗传性疾病的根本病因提供了前所未有的机遇。基于CRISPR的技术凭借其卓越的效率和便捷的可编程性,走在这场革命的前沿。本综述探讨了CRISPR基因编辑技术在研究和治疗中的现状,重点阐述了限制其发展的局限性,以及近年来为解决这些局限性而取得的技术创新。此外,我们还分析并总结了基因编辑技术在人类健康和治疗领域的应用现状。最后,我们概述了未来可能塑造基因编辑技术及其应用的潜在发展方向。

引言

基因组编辑是对生物体遗传物质进行精准靶向修饰的技术,是分子生物学领域最重大的进展之一。它应用广泛,从揭示基础生物学过程,到推动医学、农业和生物技术的发展。随着2023年底首个基于CRISPR的人类疗法获批,CRISPR基因组编辑进入了新纪元。本综述旨在全面呈现CRISPR基因组编辑领域的全貌,着重介绍其当前状态、潜在未来发展以及为充分实现其在人类医学中的潜力必须克服的障碍。

过去:CRISPR基因组编辑的发展与局限性

历史背景

基因组编辑的起源可追溯到真核生物DNA修复领域的进展。20世纪90年代初,利用归巢内切酶(如识别18 bp DNA序列的I-SceI)进行的开创性研究表明,在哺乳动物细胞中诱导靶向双链断裂(DSB)可刺激靶位点的同源重组。这确立了利用产生DSB的核酸酶进行基因组编辑的理念。对具有长识别位点、能够靶向真核基因组单个位点的多种核酸酶的需求,推动了后续基于非特异性DNA内切酶与串联序列特异性DNA结合模块的复杂融合体的工程化核酸酶的发展。这些核酸酶最初是21世纪初出现的锌指核酸酶(ZFNs),随后是2010-2011年出现的转录激活因子样效应物核酸酶(TALENs)。这些进展为基因组编辑奠定了基础,但ZFNsTALENs的设计与构建过程繁琐,限制了它们的应用。RNA引导的CRISPR相关(Cas)核酸酶的发现和开发带来了革命性的转变,因其可编程性简单、特异性强且功能多样。

2007年,研究表明原核生物CRISPR-Cas系统可作为适应性基因组防御机制,识别并靶向与病毒(噬菌体)和其他移动遗传元件相关的外源核酸。在这些系统中,入侵者DNA的片段被获取并存储在重复阵列中,其转录和后续加工产生CRISPR RNAcrRNA)。crRNA作为分子向导,编程由Cas蛋白组成的分子机制,识别入侵核酸并将其靶向破坏。后续研究发现,所谓的IICRISPR-Cas系统可位点特异性切割噬菌体DNA,其活性依赖于Cas9蛋白,且额外的RNA成分——反式激活crRNAtracrRNA)对于crRNA成熟至关重要。最终,2012年发表的生化研究表明,Cas9可作为DNA切割内切酶,其特异性由crRNAtracrRNA组成的双RNA向导结构决定。通过将tracrRNAcrRNA整合为单一向导RNAsgRNA),CRISPR-Cas9系统得到进一步简化,形成了完全可编程的单一核酸酶-单一向导RNA”设计。这成为CRISPR基因组编辑技术发展的基础——通过设计具有匹配序列的sgRNA,可将Cas9靶向特定基因组位点。Cas9RNA引导DNA切割活性的发现,引发了将其重新用于基因组编辑的热潮,最终在2013年初发表的多项研究中证实,在真核细胞中表达Cas9和特异性sgRNA,可在靶基因组位点引入遗传修饰。

基于CRISPR核酸酶的基因组编辑

CRISPR-Cas核酸酶可可编程地产生位点特异性双链DNA断裂,这使其迅速适用于基因组编辑技术。源自化脓链球菌的典型Cas9蛋白(SpCas9)是首个被重新用于基因组编辑的Cas核酸酶,由于其固有的高活性和特异性,至今仍是应用最广泛的基因编辑器。Cas9可与crRNA-tracrRNA复合物或sgRNA向导结合形成活性核酸酶。为将Cas9核酸酶导向目标基因组位点,可改变crRNA 5'端的20 nt向导序列,使其能够与DNA靶标进行标准碱基配对。靶标结合还依赖于位于DNA非靶标链(NTS)上、紧邻靶位点下游的短原间隔区相邻基序(PAM)。对PAM的初始识别会导致靶标DNA局部解旋,而向导RNADNA靶标链(TS)从靶位点的PAM近端端开始以5'-3'方向进行碱基配对,触发Cas9的构象变化,从而激活核酸酶结构域。随后,Cas9PAM序列上游3个核苷酸处切割双链DNAdsDNA)底物,产生平末端或单核苷酸5'突出端的DSBDSB的形成由Cas9HNHRuvC结构域催化,分别切割TSNTS。选择性灭活任一核酸酶结构域可将Cas9转化为RNA引导的切口酶,而灭活两个结构域则可形成RNA引导的DNA结合蛋白,作为将融合蛋白递送至特定基因组位点的平台。

Cas12a是源自VCRISPR-Cas系统的Cas核酸酶,在Cas9发现数年后被发现,同样被重新用于基因组编辑。与Cas9不同,Cas12a不需要tracrRNA即可激活,而是通过识别crRNA重复序列衍生片段中的保守假结结构,催化自身向导的核酸水解加工,这一特性已被用于体内多重编辑。Cas12a靶向含有5'TTTV PAMDNA,并利用其单一的RuvC结构域催化位点,以顺序方式切割靶位点PAM远端部分的两条链,产生5 nt5'突出端。PAM远端的DSB产物随后与蛋白质解离,而Cas12a仍保持催化活性状态,能够反式切割额外的单链DNAssDNA)底物。Cas12a已被证明是一种高效的核酸酶,能够进行精确的基因编辑,具有与Cas9互补的特性和功能。Cas12a的反式核酸酶活性还被用于序列特异性核酸检测。

图 1 CRISPR 基因组编辑的分子原理

RNA 引导的 DNA 切割:Cas9 利用由 CRISPR RNA(crRNA)- 反式激活 CRISPR RNA(tracrRNA)对或单一向导 RNA(sgRNA)组成的双向导 RNA,而 Cas12a 仅通过 crRNA 编程。靶标 DNA 识别依赖于与向导 RNA 间隔区序列的互补性以及原间隔区相邻基序(PAM)的存在。Cas9 识别 NGG PAM,而 Cas12a 需要 TTTV PAM(V=G、C 或 A)。结合靶标后,核酸酶催化 DNA 切割,产生 DNA 双链断裂(DSB)。细胞 DNA 修复途径对 DSB 的修复会导致遗传修饰(编辑):末端连接途径产生短插入或缺失(indel),而利用外源 DNA 修复模板的同源定向修复(HDR)可用于构建精确修饰。

传统基因组编辑方法依赖于在基因组中引入位点特异性双链DNA断裂,然后通过内源性细胞DNA修复途径进行修复。Cas9Cas12a酶产生的DSB通常通过易错的末端连接途径或精确的同源定向修复(HDR)机制进行修复。末端连接是哺乳动物细胞中DNA修复的主要方式,依赖于非同源末端连接(NHEJ)或微同源介导的末端连接(MMEJ)途径直接连接断裂的DNA末端。重新连接前对暴露的DNA末端进行加工,会导致核苷酸的添加或去除,从而在DSB位点产生短插入或缺失(统称为indels——这种结果被认为是由于对精确修复的DSB进行反复切割,直到积累的indels阻止进一步切割所致。这最常用于通过在邻近位置同时引入两个DSB,选择性破坏蛋白质编码基因序列,以实现基因敲除或基因缺失。Cas9诱导的DSB经末端连接修复产生的编辑结果具有可重复性,且依赖于局部序列背景,包括由NHEJ引起的单核苷酸插入或小缺失,以及由MMEJ介导的缺失。

相反,HDR是一种精确的DSB修复途径,依赖同源DNA分子指导修复结果。通过外源性提供人工同源修复模板,可利用HDR在靶向基因组位点精确引入所需的突变、插入或缺失。修复模板以双链DNA(通常通过质粒或病毒载体)或合成单链DNA寡核苷酸(ssODNs)的形式递送,其携带的所需突变两侧是与DSB两侧区域同源的序列。尽管该方法原则上能够实现核苷酸水平的精确编辑,但HDR主要仅在活跃分裂的细胞中具有活性,因为它需要通常仅在细胞周期的S期和G2期表达的修复因子。因此,HDR结果的效率取决于修复模板的类型、递送方法、细胞类型、局部染色质环境以及其他可能影响DNA修复途径选择的因素,以优先增强HDR并抑制末端连接修复。

CRISPR基因组编辑的局限性

CRISPR-Cas系统重新用作简单有效的可编程基因编辑工具,极大地推动了基础研究和应用研究的多个领域,为靶向基因疗法和各种生物技术应用的发展奠定了基础。然而,高度进化的生物防御系统的功能特征,与精确基因组编辑工具所需的功能特性存在差异。因此,第一代基于CRISPR的基因编辑工具的应用潜力受到几个关键因素的限制,主要包括特异性、靶向范围以及需要依赖内源性DSB修复机制实现基因组编辑。最后,CRISPR组件的递送受到递送载体和靶细胞或生物体的特定限制。

图 2 CRISPR 基因组编辑的局限性

CRISPR 基因组编辑面临四大主要局限性,每种局限性均有特定技术解决方案:

  1. 特异性:通过开发高保真核酸酶变体、化学修饰向导 RNA 和控制基因组编辑器核酸酶的表达,解决基因组编辑器的脱靶活性;
  2. 靶向范围:SpCas9 的 NGG PAM 序列要求限制了可靶向基因组位点的范围,通过工程化具有替代或松弛 PAM 要求的 Cas9 变体、其他具有替代 PAM 要求的天然 Cas9 同源物以及 Cas12a 酶来解决;
  3. 编辑结果控制:已开发多种方法增强 HDR 效率并抑制末端连接途径产生 indel,包括不对称或连接的 HDR 修复模板、细胞周期同步化和非同源末端连接(NHEJ)抑制剂;第二代技术(如碱基编辑或引导编辑)可独立于 HDR 实现精确修饰;
  4. 递送:通过电穿孔 / 核转染、脂质纳米颗粒和病毒载体,促进基因组编辑器组件的细胞递送。

脱靶活性

天然CRISPR-Cas系统在一定程度上容忍向导RNA与靶标之间的错配——这可能是应对噬菌体高突变率需求的进化结果。然而,这一特性对于基因组工程应用是不利的,因为除了预期的在靶位点外,它还可能导致对基因组中其他部分互补的脱靶位点进行靶向和编辑。众多研究已证实Cas9的脱靶活性,表明该酶以向导依赖的方式,容忍向导-靶标异源双链体中相当数量和种类的核苷酸错配。脱靶位点范围广泛,从含有单个碱基错配的位点,到含有多个连续错配甚至核苷酸插入或缺失的靶标。尽管Cas9具有错配耐受性,但由于Cas9DNA结合和切割机制中存在内在检查点,大多数潜在的脱靶位点仅被结合,不会导致dsDNA切割和编辑。此外,脱靶分析研究表明,与分离的基因组DNA相比,体内脱靶切割事件的频率始终较低,这表明包括基因组结构在内的其他因素可能调控细胞中Cas9的编辑活性。然而,基因组内多个位点的同时脱靶切割最终可能导致基因组重排(如缺失、倒位或染色体易位),并触发DNA损伤和应激反应途径。脱靶编辑仍然是治疗应用中的主要关注点,并促使人们投入大量精力开发可靠且灵敏的方法,用于预测和检测脱靶编辑,以及通过分子工程提高CRISPR基因组编辑器的特异性。

靶向范围:PAM要求

CRISPR核酸酶的DNA结合机制将其靶向范围限制于侧翼带有PAM序列的基因组靶位点。尽管应用最广泛的基因组编辑器核酸酶SpCas9NGG PAM在理论上平均每8个核苷酸就能找到一个合适的靶位点,但由于高A/T含量,某些基因组区域难以被SpCas9靶向。已鉴定并采用了多种具有替代PAM特异性的天然存在的Cas9同源物用于基因组编辑;然而,其中许多具有更严格的PAM要求。尽管这提供了更高的靶向特异性并降低了脱靶活性,但通常会导致DNA切割和编辑效率不理想。Cas12a核酸酶识别富含TPAM序列(通常为TTTV),但其靶向范围同样受到限制。为克服PAM要求的限制,近年来已开发了多种具有修饰或松弛PAM特异性的人工Cas9变体,如下一节所述。尽管这些变体极大地扩展了可靶向位点的范围,但松弛的PAM靶向与靶向特异性的显著降低相关,增加了脱靶效应的可能性,并由于在脱靶位点的螯合作用而降低了在靶编辑效率。

编辑结果的控制

使用靶向核酸酶在基因组内产生DSB,可显著提高哺乳动物细胞中HDR的速率。尽管如此,HDR的使用仅限于分裂细胞,且由于末端连接途径导致的同时编辑,通常会产生杂合等位基因编辑结果。此外,在预期的基因组靶位点进行编辑的精确性受到其他不利结果的限制,包括大缺失、染色体重排甚至染色体丢失。因此,大量研究致力于开发控制DNA修复结果的方法,特别是提高HDR修复的速率,从而提高敲入(插入)突变的效率。最重要的是,已证实修复模板的选择及其递送极大地影响HDR的效率。提高HDR的方法包括使用不对称ssODN模板、引入沉默突变以阻断靶位点的反复切割、或将修复供体模板与断裂位点连接。此外,将细胞周期调控与预组装的Cas9-核糖核蛋白递送相结合,也可提高HDR。通过使用小分子抑制剂暂时减慢S期或增加G2/M期细胞的比例,可实现细胞周期同步化。其他方法侧重于通过抑制关键的NHEJ因子,将NHEJHDR途径选择的平衡转向HDR。类似地,Cas9与参与HDR的修复因子(如Rad51Rad52Mre11)的直接关联,可显著提高敲入突变的速率。在原代人类T细胞中,使用设计为形成可被Cas9-RNPs识别的dsDNA末端的工程化ssDNA修复模板,结合小分子DNA修复调节剂,可实现超过80%-90%HDR编辑效率。最后,最近的研究表明,通过使用次级向导RNA重新靶向NHEJ编辑副产物,可提高HDR的效率。尽管取得了这些进展,但使用同源模板引入敲入突变(特别是长插入)仍然具有挑战性。因此,HDR不会以可观水平发生的有丝分裂后终末分化细胞(如神经元),在很大程度上仍然难以使用经典的基于DSB的策略进行精确编辑。这些限制,连同DSB潜在的遗传毒性作用,促使开发不依赖DSB且无需HDR的基因组编辑技术,包括碱基编辑和引导编辑,以及最近基于CRISPR的重组酶和转座酶。

递送

基因编辑器的靶向递送仍然是大多数体内和体外基因编辑应用的限制因素。特别是,将CRISPR组件安全、特异性且高效地递送至靶向细胞,是成功进行治疗性基因组编辑的先决条件。此外,CRISPR组件及其递送载体的免疫原性,是体内治疗应用中的一个关注点。已在人类中鉴定出预先存在的抗Cas9抗体和反应性T细胞,且在犬类和非人灵长类动物疾病模型中,Cas9免疫已被证明与治疗效果受损相关。已提出多种克服预先存在的免疫的策略,例如工程化Cas9以消除免疫原性表位、调节免疫反应以及限制Cas9表达的持续时间。

可根据靶细胞类型或生物体,以多种形式递送Cas9/Cas12a酶及其向导RNA。对于培养细胞中的大多数体外(即离体)应用,由于其高效率,电穿孔(核转染)或脂质体介导的转染仍然是最广泛使用的递送方式。Cas9和向导RNA组件可作为RNA、质粒DNA或体外重组的核糖核蛋白(RNP)复合物递送。基于瞬时RNP的递送已成为离体治疗应用中基因编辑的首选,因为从质粒中长期表达Cas9复合物可能导致高比率的脱靶编辑和随机质粒整合。对于许多模型生物中的生殖系基因组编辑,Cas9 RNPmRNA通常通过显微注射或电穿孔递送。

通常使用病毒载体实现CRISPR-Cas9向哺乳动物细胞的体内递送。腺病毒、慢病毒和腺相关病毒(AAVs)均可被工程化,以用基因编辑模块替换载体中的病毒基因。由于其低免疫原性、高转导效率和多样的细胞嗜性,AAVs仍然是体内递送的首选载体。然而,AAVs是相对较小的病毒,负载包装容量有限(4.7 kb)。因此,除非使用超紧凑启动子,否则难以将编码SpCas94.2 kb)及其sgRNA100 nt)的基因包装到单个AAV载体中。为克服这一限制,人们已将大量注意力集中在改造更小的Cas9同源物和紧凑的Cas12家族酶上。最后,可使用基于脂质的纳米颗粒(LNPs)等非病毒方法,将Cas9 mRNA与合成向导RNA或体外重组的RNP颗粒一起体内递送至细胞中。这些方法的优势在于,与基于病毒的载体相比,它们通常更安全且免疫原性更低。LNPs通过内吞作用被内化,随后LNPs的内容物要么逃离内体并转移到细胞核,要么被溶酶体降解,从而限制了其效率。最近出现了新的LNP制剂,可提高组织特异性和器官靶向的效率。总之,使用脂质纳米颗粒递送Cas9和其他基因组编辑器,已成功应用于多种细胞类型和生物体。

现在:当前技术及其应用

自首次展示基于CRISPR的基因编辑以来,该领域以前所未有的速度发展。基于Cas9Cas12a核酸酶的第一代依赖DSB的基因组编辑器的功能,通过持续创新得到了增强——这些创新不仅提高了这些工具的多功能性,还优化了其精确性,并最大限度地减少了非预期编辑后果。然而,由于脱靶编辑活性和在靶DSB的潜在遗传毒性作用(包括诱导p53),对其安全性的担忧仍然存在。为减少非预期编辑的发生,已探索了多种方法来精确时空控制CRISPR基因组编辑器,例如使用天然存在的抗CRISPR蛋白抑制剂进行组织限制性编辑。对DSB遗传毒性的担忧以及解决HDR效率低的需求,进一步促使开发不依赖DSB且无需HDR的基因组编辑技术,特别是碱基编辑和引导编辑,以及最近基于CRISPR的重组酶和转座酶。因此,当前可用技术的扩展领域提供了一种更加量身定制的基因组编辑方法,特定技术特别适合某些类型的编辑或递送方式。

图 3 当前的 CRISPR 编辑技术

基于 CRISPR 相关核酸酶及其衍生物的现有基因组编辑器技术概述:

  1. 双链 DNA 断裂(DSB)基于的基因组编辑:Cas9 和 Cas12a 核酸酶可高效实现基因敲除,并能通过 HDR 介导产生有限的敲入编辑;
  2. 碱基编辑:该方法将 Cas9 切口酶(nCas9)与核苷酸碱基修饰酶融合,无需双链断裂即可直接将单核苷酸碱基转换为另一种碱基,特别适用于引入点突变(A-to-G 或 C-to-T,也包括 A-to-C 或 C-to-G),实现精确基因校正或引入终止密码子以实现精确基因敲除;
  3. 引导编辑:该技术将 Cas9 切口酶与逆转录酶(RT)结合,使用包含 Cas9 sgRNA、RT 模板(RTT)和引物结合位点(PBS)的引导编辑向导 RNA(pegRNA);对非靶标 DNA 链进行切口后,使其与 pegRNA 中的 PBS 杂交,随后通过 RT 延伸,将 RTT 序列复制到靶位点,可实现长达数十个核苷酸的短 DNA 序列插入、缺失和替换;
  4. 转录调节剂:通过将催化失活的 Cas9(dCas9)与转录调节结构域(如 VP64 或 KRAB)融合并靶向基因启动子,实现 RNA 引导的基因转录控制;
  5. RNA 编辑器:与基因组编辑不同,RNA 编辑器利用 RNA 靶向的 Cas13 核酸酶,要么用于靶向转录本降解(催化活性状态),要么用于转录本编辑(催化失活状态并融合腺苷脱氨酶),实现腺苷(A)到肌苷(I)的转换。

尽管基因组编辑工具的这些新增功能极大地有助于解决与经典CRISPR基因组编辑相关的许多限制,但它们仍然在活性、特异性和递送方面存在局限性。本节概述了当前技术的发展历程、它们帮助缓解的局限性以及它们仍然面临的剩余限制。

超越Cas9的核酸酶

Cas9作为基因组编辑器核酸酶的初步开发,激发了后续旨在鉴定具有基因组工程潜在应用的新型天然存在的Cas酶的研究。由于这些努力,近年来已发现并采用了十多种新的进化多样性RNA引导的核酸酶用于基因组编辑。2015Cas12a的发现标志着超越Cas9的关键扩展,提供了一种具有独特PAM要求、向导RNA格式和DNA切割模式的替代核酸酶。据报道,Cas12a酶在体内表现出更高的特异性和更低的脱靶活性,部分原因是其较慢的DNA切割速率。随后的生物信息学探索发现了一系列具有独特PAM和向导RNA要求的VCas效应物。特别令人感兴趣的是最小的紧凑V类核酸酶,它们有望应用于需要将基因编辑器组件包装到尺寸受限的病毒载体(如AAV)中的场景。最后,来自VICRISPR-Cas系统的RNA靶向RNA引导的核酸酶(如Cas13Cas12a2Cas12g)为分子编辑工具库引入了一种新的模式,允许靶标mRNA的降解或编辑,以及核酸检测。尽管这些发现带来了新的功能,但每种Cas核酸酶都有其自身的局限性,包括受限的PAM靶向、可变的体内活性和脱靶谱,或潜在的免疫原性。尽管如此,多种酶的可用性现在允许采取更加量身定制的基因组编辑方法,为各种应用提供灵活性。这些酶中的许多在向导RNA方面的正交性,对于多重应用特别有用。

高保真Cas9变体

为解决脱靶活性问题,已使用两种互补方法开发了具有改进特异性的SpCas9工程化变体。第一种方法涉及基于结构的保真度增强突变的合理设计,其理念是消除Cas9蛋白与结合的DNA靶标之间的特定接触,使Cas9-向导RNA复合物对底物DNA中的错配更敏感,从而降低脱靶结合和切割的概率。这些变体的生物物理和生化研究表明,突变显著减慢了DNA切割速率,从而促进脱靶释放。第二种方法利用定向进化方法选择减少脱靶编辑的突变。已进行了类似的努力来工程化其他Cas9Cas12a酶的高保真变体。尽管迄今为止开发的高保真变体比野生型酶具有显著提高的特异性,但它们的效率在不同的DNA靶标和应用中可能有所不同。此外,由于每个靶标都与一组具有可变编辑频率的独特脱靶标相关,因此目前可用的高保真核酸酶变体可能都无法普遍适用。

向导RNA修饰

通过工程化基因组编辑器的向导RNA来提高特异性,是采用高保真核酸酶突变体的一种有吸引力的替代方案。此类努力最初侧重于使用Cas9的截短向导RNA,其中向导片段从20个核苷酸截短至17-18个核苷酸。已表明,这些截短向导RNA可显著降低SpCas9在多个位点的脱靶活性,但也表现出效率降低或在新的脱靶位点触发编辑。通过引入二级结构或未配对核苷酸对向导片段进行5'端修饰,也已被证明可减轻脱靶识别。多项研究已证实杂合”RNA-DNA向导的功能,并发现向导片段内的2'-脱氧核苷酸取代可显著提高细胞中基因编辑的特异性。在向导RNA中引入其他化学修饰(如2'-O-甲基或2'-氟核苷酸以及硫代磷酸酯键),也已成为提高Cas9特异性和增强向导稳定性的有力策略。其中一些修饰在体内表现出强大的基因编辑活性,但与DNA取代类似,修饰核苷酸的效果高度依赖于位置。

替代PAM基因组编辑器

为克服Cas核酸酶的PAM依赖性靶位点限制,多项研究试图通过基于结构的合理工程化或定向进化,在PAM相互作用结构域中引入改变特异性的氨基酸取代,以扩展SpCas9PAM靶向范围。这最初导致开发了VQREQRVRER SpCas9变体,分别能够靶向NGANNGNGNGCG PAM。在靶向非G PAM的其他工程化变体中,SpCas9PAM选择性得到了进一步松弛。为了使更广泛的基因组位点可被CRISPR-Cas9靶向,最近的努力成功地工程化了能够靶向NRN PAMSpCas9变体,包括近乎PAM”Cas9设计。尽管这些变体的体内编辑活性高度可变,但它们显著扩展了Cas9的靶向潜力并简化了靶位点选择,补充了野生型SpCas9和其他天然衍生的Cas9同源物。类似地,也已开发了具有松弛PAM特异性的Cas12a变体用于编辑应用。

碱基编辑

基于CRISPR的碱基编辑器(BEs)已发展成为一种多功能技术,能够在不需要产生DSB和提供同源修复模板的情况下产生靶向点突变,从而能够在HDR缺陷型细胞中进行编辑。BEsRuvC灭活的切口酶版本的Cas9与核苷酸脱氨酶的模块化融合体。最初,开发了两类BEs。胞嘧啶BEsCBEs)包含源自胞苷脱氨酶(如APOBEC1)的催化结构域以及尿嘧啶糖苷酶抑制剂(UGI)结构域,介导C-to-T转换。反过来,腺嘌呤BEsABEs)利用来自tRNA特异性脱氨酶TadA的腺苷脱氨酶结构域(通过定向进化工程化以作用于ssDNA)产生A-to-G转换。结合Cas9模块后,BEsdisplaced 非靶标DNA链的PAM远端片段的编辑窗口内,将胞嘧啶或腺嘌呤脱氨基为尿嘧啶或肌苷。这些在DNA复制过程中分别被读取为胸腺嘧啶和鸟嘌呤,诱导转换点突变。自发明以来,原始的CBEABE编辑器经历了多次设计迭代,以提高活性并减少脱氨酶诱导的脱靶编辑,并且还开发了Cas12a BEs。碱基编辑的范围还已扩展到涵盖A-to-CA-to-YC-to-G颠换。由于其编辑结果在很大程度上可预测,BEs已被应用于全基因组敲除和突变筛选。BEs的精确性使其适合用于治疗由单点突变引起的疾病。尽管BEs允许对编辑结果进行更精确的控制,但它们确实存在一些局限性。这些局限性包括效率有限、旁观者编辑、广泛的编辑窗口以及显著的脱靶活性。最新一代ABE变体比CBEs表现出更高的编辑效率和更低的Cas9非依赖性脱靶编辑频率,这促使通过ABE的定向进化来工程化新的CBE变体。最后,尽管频率低于基于经典核酸酶的Cas9编辑,但ABECBE都可能通过在在靶位点产生DSB、缺失和易位,产生不期望的遗传毒性作用。这些可以通过调节递送时间和编辑器表达水平来部分缓解。

引导编辑

引导编辑是一种基于Cas9的方法,旨在以HDR非依赖性方式产生靶向点突变以及插入或缺失。引导编辑器由引导编辑向导RNApegRNA)和由HNH结构域灭活的Cas9切口酶与工程化逆转录酶(RT)结构域组成的融合蛋白构建体组成。pegRNA包含3'端序列延伸,该延伸与预期基因组靶标的NTS互补,并包含所需的突变(多个突变)。Cas9NTS中产生切口,然后与互补的pegRNA延伸进行碱基配对。然后通过RT催化的、以pegRNA为模板的NTS 3'端延伸引入突变。随后,DNA链重新退火以产生5' flap中间体,该中间体经过切除和连接,将编辑固定在基因组DNA中。这种靶向链合成允许引入长达40 bp的插入或长达80 bp的缺失,以及距离Cas9切口位点最远30 bp的点突变。从第一代引导编辑器设计(其中切口酶Cas9与来自莫洛尼鼠白血病病毒(MMLV)的野生型RT融合)开始,后续的PE设计代通过纳入具有增强热稳定性的工程化MMLV RT结构域,并引入第二个sgRNA以在非编辑链上产生切口以促进编辑在基因组DNA中的保留,从而提高了引导编辑效率。通过抑制DNA错配修复途径,以及通过改善核定位、表达和DNA切口,已实现了进一步的改进。此外,已证实向pegRNA3'端添加稳定的二级结构以抵消其降解,可增强引导编辑效率。

迄今为止,引导编辑已成功应用于多种生物体和细胞类型。然而,根据预期的编辑、靶位点序列和细胞类型,引导编辑效率高度可变且通常较低。此外,引导编辑并未完全避免在靶DSB的产生,导致非预期且潜在的遗传毒性作用。为解决这些局限性,性能改进的新型PE变体不断被开发,包括能够使用pegRNA对产生更广泛编辑的系统。

转录调控:CRISPRiCRISPRa

CRISPR技术不仅适用于基因组编辑,还能够瞬时操纵基因表达。Cas9的催化失活突变体最初在细菌中用于靶向基因启动子并空间阻断RNA聚合酶,从而抑制RNA转录。为了在真核细胞中抑制基因表达,无核酸酶活性的Cas9可与各种转录和表观遗传调节剂(例如KRAB转录阻遏物结构域)融合,并靶向活跃转录基因的启动子区域。由此产生的方法称为CRISPR干扰(CRISPRi),能够有效敲低基因表达,作为基于小干扰RNAsiRNA)的RNA干扰的替代方案。类似地,无核酸酶活性的Cas9蛋白融合体可用于激活特定基因的表达,要么通过直接募集转录激活因子,要么通过调节染色质状态。通过将dCas9VP64及其衍生物等反式激活结构域融合,已实现了CRISPR激活(CRISPRa)。或者,与组蛋白修饰酶(如脱甲基酶或乙酰转移酶)融合,可位点特异性地改变特定位点的表观遗传标记,并诱导活跃的染色质状态以驱动基因表达。此类方法已被轻松适用于全基因组功能丧失(CRISPRi)或功能获得(CRISPRa)筛选。然而,由于Cas9DNA结合通常比切割更具包容性,CRISPR指导的转录调控存在相当大的脱靶活性。

靶向RNA沉默和修饰

来自VICRISPR-Cas系统的RNA引导、ssRNA靶向Cas13酶的发现,导致了用于靶向RNA沉默以及编辑和修饰的分子工具的发展。由于RNA编辑是瞬时的,因此在某些情况下,转录组编辑可能是基因组编辑的一种有吸引力的替代方案。例如,在疼痛、炎症或病毒感染等急性疾病中,瞬时RNA编辑可提供暂时的治疗效果,而不会引入永久性遗传改变。当前的RNA编辑方法基于将无核酸酶活性的dCas13蛋白与作用于RNA的腺苷脱氨酶(ADAR)融合,以催化靶标RNA分子内的腺苷脱氨基,产生肌苷碱基。Cas13向导RNA与靶标RNA的杂交产生ADAR酶的dsRNA底物。产生的肌苷可有效地与胞嘧啶进行碱基配对,因此在翻译过程中被读取为鸟苷,导致在mRNA中引入相当于A-to-G转换的密码子变化。随后的蛋白质工程努力导致开发了一种ADAR2变体,能够在RNA中进行Cas13指导的C-to-U转换。使用dCas13蛋白融合体进行靶向RNA修饰的概念已被进一步扩展,以开发能够在位点特异性地在靶标mRNA中安装N6-甲基腺苷(m6A)修饰的表观转录组编辑器

基础研究和人类医学中的当前应用

CRISPR基因组编辑的技术进步带来了众多具有显著提升人类健康潜力的应用,从基础研究的进展到新治疗方法的开发。首先,CRISPR通过允许科学家在各种实验模型中模拟致病突变、创建大规模全基因组筛选方法以及开发用于研究正常发育和疾病进展的合成遗传记录装置,彻底改变了遗传研究。尽管本文未详细综述,但CRISPR系统已被重新用于开发分子诊断技术,能够特异性、快速且灵敏地检测病毒DNARNACRISPR技术还被用于建立消除病毒或细菌人类病原体的策略,后者通过开发工程化噬菌体实现。限制病原体传播的一个具体例子是基于CRISPR的基因驱动,其中引入特定的抑制性特征(如雌性不育)以消灭携带病原体的昆虫种群,主要是传播疟疾的蚊子。最后,过去十年的CRISPR基因组编辑最终促成了多种遗传性疾病治疗方法的开发,其中一些已从基于细胞和动物模型的临床前研究进入人类临床试验。这包括体内和体外治疗校正策略。体内治疗校正策略涉及将基因编辑组件递送到人体内受影响的组织。相比之下,体外方法涉及从患者收集细胞,在实验室中进行编辑,然后将编辑后的细胞移植回患者体内。体外CRISPR编辑还能够产生自体和异基因基因组修饰的细胞疗法,主要用于癌症免疫治疗。

反向遗传学:细胞、类器官和动物中的疾病建模

识别导致人类疾病的特定等位基因是遗传研究的重点。下一代测序技术提高了我们精确定位可能导致这些疾病的突变的能力。然而,要最终确定特定变体是遗传性疾病的致病因素,必须通过反向遗传学方法进行实验验证。特别是,CRISPR基因组编辑有助于生成等基因细胞疾病模型,使研究人员能够将特定突变引入野生型细胞,或者相反,将患者来源细胞中的突变恢复为野生型以生成对照细胞系。在人类细胞中展示Cas9的基因组编辑活性后不久,CRISPR基因组编辑在专注于在患者来源的细胞、类器官或模型生物体中模拟疾病表型的研究中得到了广泛应用。人类诱导多能干细胞(iPSCs)为模拟疾病表型提供了强大的方法。通过编辑这些细胞并引导它们分化为受疾病影响的特定细胞类型,研究人员可以在相关的细胞环境中研究疾病。基于CRISPRiPSC模型对于影响否则难以接近的组织或器官(如大脑)的疾病特别有价值。CRISPR工程化类器官能够模拟受疾病影响的器官的复杂性,已被用于通过在肿瘤抑制基因或癌基因中工程化突变来模拟癌症。包括秀丽隐杆线虫和斑马鱼在内的CRISPR工程化模型生物,也有助于建立特定突变与人类遗传性疾病之间的联系。这些模型在复制罕见的人类发育障碍方面特别成功。啮齿动物(主要是小鼠)是最常用的动物疾病模型,其中CRISPR编辑促进了多重或条件性基因敲除或敲入的产生。包括非人灵长类动物、猪和狗在内的大型动物模型,在生理和遗传上与人类更相似。它们更长的寿命使它们特别有价值用于研究衰老和慢性疾病的进展,随着时间的推移提供更接近人类病理的近似值。CRISPR工程化非人灵长类动物为深入了解发育过程提供了见解。类似地,人类心血管疾病已在CRISPR编辑的猪或狗中成功建模。此外,生成啮齿动物和大型动物模型的能力,除了验证疾病相关变体和理解疾病机制外,至关重要,因为这些模型为旨在治愈此类疾病的治疗干预措施的临床前评估提供了重要平台。CRISPR基因组编辑能够生成大型动物模型,而无需维持大量繁殖种群,具有显著的经济和动物福利效益。CRISPR基因组编辑的一个主要优势是,通过使用不同的向导RNA同时靶向多个基因组位点,可以工程化多重编辑。这种方法已能够生成携带多个基因突变的动物模型,以及通过使用不同的sgRNA序列在单个细胞中靶向多达62个独特的遗传位点,多重灭活内源性逆转录病毒。除了模拟导致疾病的突变外,使用CRISPR进行多重基因组编辑还彻底改变了生物技术的其他领域,特别是用于农业应用的植物工程和用于工业生物生产的微生物中的代谢途径工程。

正向遗传学:CRISPR筛选、谱系追踪和分子记录器

全基因组敲除筛选等正向遗传学方法是研究健康和疾病中生物学功能的强大工具。利用基因组编辑的持续进展,CRISPR筛选能够系统地扰动细胞内数千个个体基因和非编码基因组元件,从而有助于识别与特定生物学途径及其相互作用相关的基因。在这些高通量筛选中,向导RNA文库与Cas酶一起递送至细胞,通常通过慢病毒载体池的转导,确保每个细胞接收不同的sgRNA。在应用基于细胞存活或读数的选择后,使用下一代测序来识别哪些向导RNA在细胞群体中富集或相反丢失,从而识别与特定表型相关的靶基因。这种通用方法已被改编为使用多种类型的CRISPR技术,包括用于敲除筛选的CRISPR核酸酶、CRISPRiCRISPRaBEsPEs以及Cas13,允许研究广泛的遗传修饰。早期的汇集CRISPR筛选旨在识别有助于细胞生长或药物抗性等易于选择的表型的基因。多重CRISPR筛选也已用于发现抑制癌细胞生长的成对遗传相互作用。此外,还在斑马鱼胚胎中进行了体内汇集CRISPR筛选,灭活单个基因并分离具有靶向表型的胚胎,以识别负责任的遗传改变。能够有效引入点突变的BEs,已成为功能丧失和功能获得遗传变体筛选的特别强大的工具。

CRISPR筛选与单细胞组学方法的整合极大地增强了我们研究基因功能的能力。PERTURB-seqCRISP-seqCROP-seqMosaic-seq等方法使用单细胞RNA测序来追踪单个细胞中的sgRNA,并同时监测CRISPR诱导的扰动后的全谱基因表达变化。这些方法的进一步完善使得能够直接研究体内基因功能,例如分析小鼠大脑中与神经发育障碍相关的基因。此外,这些方法已与空间分辨单细胞RNA测序相结合,以剖析肿瘤中癌症和免疫细胞之间的复杂相互作用,或与单细胞质谱联用,用于详细的蛋白质表达谱分析。

除了全基因组筛选外,CRISPR基因组编辑工具还促进了谱系追踪方法的发展,以能够监测细胞增殖和重建细胞谱系树。谱系追踪通过将人工DNA条形码引入细胞及其随时间的Cas9持续编辑来实现,使用单细胞RNA测序检测以绘制细胞系统发育,并将其与单细胞转录组输出整合。例如,这些方法已成功重建了斑马鱼发育和小鼠胚胎发生过程中的细胞谱系,并追踪了转移性癌细胞的进化和动态。CRISPR基因组编辑已能够开发合成记忆装置,将瞬时分子事件的信息记录到DNA条形码中。这包括关于过去转录历史、特定顺式调节元件的活性或暴露于某些环境因素的信息。此类分子记录器通过将特定分子事件与独特的、可检测的基因组编码编辑的产生相关联来发挥作用,从而有助于追踪这些事件的存在、强度、持续时间和相对时间。在细菌中,基于包含RTCRISPR间隔区获取机制的转录记录,能够直接、按时间顺序捕获基因组中转录RNA的序列。该技术的应用已扩展到小鼠肠道微生物组的体内研究。

体外治疗应用

患者来源细胞的体外基于CRISPR的基因组编辑,随后进行扩增和再移植,是治疗血液细胞中表现出的遗传性疾病的强大策略。成功开发遗传性血红蛋白病治疗方法就是例证,其中首个方法现已在欧洲、英国和美国获批。镰状细胞贫血(SCD)和输血依赖性β-地中海贫血(TDT)由血红蛋白亚基βHBB)中的一系列突变引起。尽管原则上可以通过校正性基因组编辑来解决这些突变,但重新激活胎儿γ-珠蛋白(HBG)表达(通常在出生后被转录阻遏物BCL11A沉默)提供了一种更易于处理的解决方案。这已通过Cas9 RNP电穿孔,在CD34+造血干细胞中靶向破坏BCL11A基因中的红细胞增强子来实现。

嵌合抗原受体(CART细胞疗法涉及T细胞的体外工程化,以靶向B细胞恶性肿瘤和多发性骨髓瘤中的癌症细胞标志物(如CD19B细胞成熟抗原(BCMA)),从而在输注到患者体内后破坏癌细胞。在目前获批的自体CAR-T细胞疗法中,CAR编码基因通过慢病毒载体的转导随机插入基因组中。此外,细胞需要复杂、易失败的制造过程。为解决这些局限性,通过CRISPR编辑供体来源的T细胞产生的异基因CAR-T细胞,可提供增强的功能、简化的生产和增强的质量控制。使用HDRT细胞受体α恒定区(TRAC)基因座进行CRISPR指导的CAR构建体插入,可避免移植物抗宿主病,而敲除PDCD1Regnase-1TGFBR2基因旨在减少CAR-T细胞耗竭并增加持久性。目前正在进行多项针对一系列血液癌症的CRISPR编辑CAR-T细胞疗法的临床试验。一个显著的例子是,多重碱基编辑的CAR-T细胞已被用于治疗复发的T细胞白血病(一种以前无法治愈的疾病)的儿童患者。

未来基因组疗法的一种潜在强大策略是将体外CRISPR基因组编辑与iPSC技术相结合。最近开发的一种用于治疗1型糖尿病的方法,涉及基因组工程化iPSC,将其分化为胰腺内胚层细胞,并封装在生物相容性装置中植入患者体内,以实现胰岛素生产——这对于治疗1型糖尿病至关重要。在这些复杂的方案中,CRISPR编辑可用于删除一组基因以促进移植物接受、保护工程化细胞免受应激以及优化胰岛素生产。CRISPR基因编辑还用于动物异种移植研究。例如,防止猪肺异种移植物中免疫排斥的靶向遗传修饰,已改善了非人灵长类动物受者的移植物接受度。

体内治疗应用

与体外策略相反,体内治疗性基因编辑涉及通过局部或全身递送,将CRISPR基因组编辑器直接施用于体内受影响的组织。多项概念验证临床前研究已成功证明体内治疗性基因组编辑,特别是通过使用AAV9载体进行肌肉定向递送Cas9和向导RNA,在杜氏肌营养不良症动物模型中恢复肌营养不良蛋白表达,以及通过AAV9介导的CBE递送至大脑,在该疾病的小鼠模型中挽救脊髓性肌萎缩症。另一种早期方法涉及将CRISPR组件直接注射到眼睛中,以减轻Leber先天性黑朦10型(一种由CEP290基因中的致病性突变引起的视网膜营养不良)。在这种情况下,由组织特异性启动子驱动以实现精确性的Cas9,与向导RNA一起包装在AAV5载体中,并通过视网膜下注射递送至受影响区域,以恢复小鼠和非人灵长类动物的视力。

图 4 与人类健康相关的 CRISPR 基因组编辑器应用

CRISPR-based 基因组编辑在基础研究和基因治疗中的应用概述:

  1. CRISPR 诱导的基因敲除或突变:Cas9 核酸酶、碱基编辑器和引导编辑可在培养细胞系和动物中生成特定遗传改变(包括基因敲除、敲入和靶向突变),用于模拟人类遗传疾病变体;
  2. CRISPR 筛选:利用向导 RNA 文库进行高通量基因功能分析,将文库转导后的细胞进行选择分析,通过下一代测序分析细胞群体中向导 RNA 的富集或缺失,从而鉴定参与特定生物学过程的基因;可使用 CRISPR 核酸酶、CRISPRi/a 转录调节剂以及碱基编辑器和引导编辑进行筛选;
  3. 体外治疗性基因编辑:在受控实验室环境中编辑患者或健康供体来源的细胞,再将修饰后的细胞(重新)引入患者体内;
  4. 体内治疗性基因组编辑:直接将 CRISPR 基因组编辑器递送至患者体内,靶向特定器官或组织,通常使用基于脂质纳米颗粒或病毒载体的方法。

肝脏是体内基因编辑的理想靶标,因为其不连续的毛细血管结构有助于通过低密度脂蛋白(LDL)受体途径摄取全身施用的脂质纳米颗粒。转甲状腺素蛋白(TTR)淀粉样变性是由错误折叠的TTR在心脏或神经系统中有害积累引起的疾病。由于TTR主要在肝脏中产生,TTR淀粉样变性的有效治疗策略已使用LNP介导的Cas9 mRNA和合成sgRNA递送来敲除肝脏中的该基因。在一项临床试验中,这种方法显示出血清TTR水平的显著降低,这是首个成功的全身递送体内CRISPR基因疗法案例。

临床试验也在探索家族性高胆固醇血症(一种以血液LDL胆固醇水平高为特征的疾病)的治疗方法。其中一种创新方法涉及基于LNPCRISPR ABEs全身递送,以靶向肝脏中的前蛋白转化酶枯草溶菌素/kexin 9型(PCSK9)基因,旨在通过敲除该基因来降低血液LDL胆固醇。在非人灵长类动物中,这种方法已显著降低了PCSK9水平和血清LDL胆固醇,且不影响生殖系组织,为I期临床试验奠定了基础。一种增强的治疗策略将ABE mRNAPCSK9特异性sgRNA一起封装在独特配制的、具有多价N-乙酰半乳糖胺(GalNAc)配体的LNPs中,改善LDL受体缺陷患者的肝细胞摄取。

未来:新兴技术

在过去十年中,随着当前CRISPR技术的局限性变得越来越明显,新的方法和方法论不断被开发和微调,以解决这些限制并提高基于CRISPR的基因组编辑的功效和多功能性。这些新兴的第三代工具和技术包括最近发现的紧凑型RNA引导的核酸酶类别,已被改编用于基于DSB的编辑,也可用作其他基因组编辑器模式(如BEsPEs)的RNA引导的DNA结合平台。在缺乏HDR的有丝分裂后细胞中插入长的基因大小的DNA序列,仍然是基因组编辑领域的主要未满足需求。在这种情况下,CRISPR指导的重组酶和转座酶的发展,为填补这一技术空白提供了有希望且潜在强大的途径。基于逆转录转座子的基因组编辑技术和RNA转录本编辑的新方法也已出现。最后,新基因组编辑器工具的创建,与递送方法的发展齐头并进——这代表了治疗应用的主要挑战。总体而言,这些发展反映了快速发展的基因组编辑领域的动态,其中每种新方法都提供了互补优势,以解决遗传操作的多样化需求和挑战。

图 5 基因组编辑中的新兴技术

基因组编辑领域新兴技术总结:

  1. DNA 聚合酶编辑器:将 Cas9 切口酶与 DNA 聚合酶结合,并通过 HUH 内切酶等工具连接单链 DNA 模板,与引导编辑的关键区别在于使用 DNA 聚合酶而非逆转录酶,且 DNA 模板反式递送;
  2. CRISPR 相关转座子:这些天然存在的移动遗传元件利用 CRISPR 效应复合物与转座酶蛋白结合,通过 RNA 引导的转座将长 DNA 序列插入特定基因组位点;
  3. 工程化 CRISPR 整合酶:基于引导编辑与位点特异性丝氨酸重组酶的结合,先通过引导编辑在靶标 DNA 位置引入重组酶附着位点(att 位点),随后通过重组酶催化插入大型 DNA 负载;
  4. 靶标引发的逆转录:将切口酶 Cas9 与非长末端重复序列(non-LTR)逆转录转座子衍生的逆转录酶和 RNA 融合,通过切割靶标 DNA 产生游离 3' 端,启动逆转录转座子相关 RNA 的逆转录,实现靶向 DNA 插入;
  5. 表观基因组编辑:将催化失活的 dCas9 与 DNA 甲基转移酶和组蛋白修饰酶融合,可在特定基因组位点实现靶向染色质修饰,在不改变 DNA 序列的情况下实现基因表达的可遗传抑制(CRISPRoff);通过 Cas9 与 DNA 脱甲基酶和转录激活结构域融合靶向受抑制基因,实现基因重新激活(CRISPRon);
  6. 基因编辑中的人工智能:人工智能在全新蛋白质和向导设计、脱靶位点预测及编辑结果预测方面取得重大进展。

最小祖先RNA引导的核酸酶

寻找新型RNA引导的核酸酶的持续努力,很大程度上是出于对具有正交向导RNA支架和靶向能力的替代酶的需求,理想情况下具有最小尺寸,这将有助于构建融合蛋白(如BEsPEs)及其使用病毒载体的高效细胞递送。最近通过深度突变扫描和基于结构的设计,对超紧凑的Cas12f核酸酶(422个氨基酸)进行工程化以增强其体内编辑活性,就是例证。由于旨在发现新的天然存在的RNA引导的核酸酶的持续研究,分子基因组编辑工具库最近也得到了扩展。这些努力集中在Cas9Cas12酶的进化祖先,即IscB/IsrBTnpB上。这些蛋白质(也统称为HEAROHNH内切酶相关RNAORF)或OMEGA(必需移动元件指导的活性)核酸酶)编码在原核转座元件中,在其中它们有助于转座机制并促进转座子保留。已证实IscBTnpB核酸酶均能够在人类细胞中介导可编程基因组编辑。被称为Fanzors的真核TnpB样蛋白(400-700个氨基酸)的发现,也已被证明能够催化RNA引导的DNA切割并支持可编程基因组编辑,突显了RNA引导的核酸酶在所有生命领域中的普遍性。这些核酸酶的紧凑尺寸应有助于其递送;然而,需要进一步的分子工程努力来提高其目前较低的效率和有限的靶向范围。

DNA聚合酶编辑器

PEs(其中RTCas9切口酶融合,使用部分向导RNA作为模板,在靶位点RNA模板引入修饰)不同,正在探索利用DNA聚合酶将靶向突变引入基因组的新方法。在早期尝试中,使用与Cas9切口酶变体融合的工程化易错DNA聚合酶,在距靶位点高达350个核苷酸的可调窗口内实现了核苷酸的连续多样化。最近的一项研究表明,反式提供的噬菌体衍生的DNA聚合酶,可使用 tethered线性DNA模板,在Cas9切口位点引入编辑。与基于RT的引导编辑相比,这种方法避免了向导RNA内的自身抑制性分子内碱基配对,并允许超过100个核苷酸的更长插入。另一种新方法称为点击编辑,将Cas9DNA依赖性DNA聚合酶(DDPs)和HUH内切酶相结合,能够引入多种基因组编辑,包括所有单核苷酸取代以及短插入和缺失。该过程利用HUH内切酶的生物缀合活性,将点击DNA”模板共价附着到HUH-nCas9-DDP蛋白融合体上。这种方法不仅有助于以最小的indels进行精确的基因组编辑,还避免了非预期的插入。基于DNA聚合酶的编辑技术,因其能够诱导广泛的遗传改变而脱颖而出,提供了高度的控制和多样化的结果。

CRISPR指导的重组酶和转座酶

依赖dsDNA断裂的模板指导修复的基因组编辑,在很大程度上仅限于HDR活跃的增殖细胞,在有丝分裂后细胞中不能有效发挥作用。此外,HDR介导的插入效率与插入大小成反比,严重限制了将长DNA片段或整个新基因插入基因组的能力。尽管引导编辑有助于在不依赖HDR的情况下引入插入,但目前插入仅限于几十个核苷酸。最近,通过将PEs与丝氨酸重组酶/整合酶相结合,扩展了PEs的能力,其中引导编辑器介导的重组酶识别位点的安装,使得重组酶能够随后插入多千碱基的DNA序列。新型重组酶的系统发现和表征,将有助于进一步优化这些方法,以提高其效率和特异性。

转座子能够自主催化大DNA插入,而不依赖DSB的产生和修复。多项研究试图将无核酸酶活性的Cas9与各种转座酶(包括睡美人、水手和猪gyBac)融合,用于细胞中RNA介导的转座。尽管这些方法提高了靶位点附近的转座事件频率,但总体低效率和高频率的脱靶转座事件,目前阻碍了它们作为靶向基因插入技术的广泛使用。与工程化Cas9-转座酶融合体不同,CRISPR相关转座子(CAST)系统是天然存在的Tn7样转座元件,已选择I类或VCRISPR-Cas系统作为靶向模块,以介导RNA指导的DNA转座。该系统能够在细菌中高效、位点特异性地插入。广泛的结构和功能研究阐明了CASTs的机制,为这些系统的分子工程化提供了框架,以实现哺乳动物细胞中的靶向DNA转座。尽管VCASTs的效率仍然相当低,但ICASTs在人类细胞中显示出有希望的活性迹象,突显了这些系统作为位点特异性插入大遗传负载的技术的潜力。尽管如此,需要对天然存在的CASTs进行进一步的系统功能表征,以及机制研究和工程化努力,以实现强大的基因组编辑和治疗性基因递送所需的功效水平。

基于逆转录元件的编辑

CASTs不同,逆转录元件(特别是非长末端重复序列(non-LTR)逆转录转座子)代表了一种新兴方法,能够以潜在更高的效率和特异性实现长DNA序列的可编程插入。与PEs一样,逆转录元件通过靶标引发的逆转录(TPRT)催化DNA插入,该机制涉及切割靶标DNA并使用切口的暴露3'端引发逆转录转座子RNA的逆转录。家蚕R2元件的最新结构研究揭示了其靶标DNA识别和TPRT起始的机制。使用Cas9切口酶,可将逆转录元件重新靶向非天然DNA序列,概述了一种使逆转录元件适应靶向DNA插入的可能策略。与其他方法相比,逆转录元件可能为递送更大的基因大小的DNA负载提供独特优势。然而,插入的精确性和脱靶效应的控制需要进一步验证。此外,逆转录元件介导的整合效率可能因靶细胞类型和基因组背景而异,限制了其普遍适用性。

表观基因组编辑

引入永久性遗传修饰带来了重大风险(如非预期突变),并在生殖系基因组编辑的背景下引发了伦理问题。基于CRISPR的表观基因组编辑——引入不影响生殖系DNA但可通过多个细胞世代持续存在的靶向表观遗传修饰,提供了一种有希望的替代方案。通过将DNA和组蛋白修饰酶与无核酸酶活性的Cas9融合,可在特定基因组位点重构染色质,以诱导或抑制靶基因表达。最近建立的一种称为CRISPRoff的表观基因组编辑器方法,利用DNA甲基转移酶(如Dnmt3ADnmt3L)与KRAB转录阻遏物结构域相结合,在增殖细胞中高效且持续地沉默基因表达,跨越多个世代。这种沉默可通过CRISPRon(一种结合了Cas9DNA脱甲基酶TET1和转录激活结构域的多部分编辑器)逆转,以重新激活表达。乙酰化是表观遗传组蛋白修饰的另一种形式,其中组蛋白乙酰转移酶(HATs)和组蛋白脱乙酰酶(HDACs)可分别用于修饰染色质,从而激活或抑制基因表达。然而,某些限制仍然存在。由于Cas9仅可基于向导RNA的种子序列瞬时结合到脱靶位点,组蛋白和染色质修饰剂可能会无意中影响脱靶基因的转录状态。此外,这些表观遗传改变的长期影响和稳定性仍需要更详细的研究,以充分了解其后果,特别是在复杂疾病的背景下。

RNA编辑

与表观基因组编辑一样,直接在mRNA中引入靶向突变,由于mRNA在细胞内的寿命有限,可能是一种比编辑DNA更安全的替代方案。RNA编辑方法已发展为提供对编辑结果更精确和多功能的控制。最近的一项此类进展来自Cas7-11系统的发现,这是一种新型单蛋白CRISPR-Cas效应物,使用向导RNA切割靶标RNA。与基于Cas13a的敲低方法相比,该系统已被重新工程化,以在哺乳动物细胞中以最小的脱靶活性敲低转录本,且显然没有附带切割活性。此外,最近报道了一种用于CRISPR介导的长RNA转录本反式剪接的新方法。通过利用RNA靶向Cas13酶与反式剪接RNA相结合,该技术能够替换或插入哺乳动物mRNA转录本中的大片段。这些新技术对治疗开发具有重要意义,特别是对于可以通过瞬时基因校正解决的遗传性疾病。因此,RNA编辑为基因组医学中更复杂和靶向的方法提供了机会,并扩大了需要瞬时或可逆遗传调控的治疗的潜力。

新型递送方法

基因编辑器复合物向靶细胞或器官的高效和精确递送,仍然是基因组编辑的最显著限制因素。目前正在开发多种策略,以提高基于CRISPR的基因组编辑器的递送效率并最大限度地减少其潜在免疫原性。首先,最近开发了新的LNP制剂,以实现组织特异性靶向,从而提供了一种多功能方法,用于包装和递送CRISPR组件,增强细胞摄取并减少脱靶编辑。细胞穿透肽也已显示出作为CRISPR酶递送方法的相当大潜力,特别是在原代人类淋巴细胞、神经元细胞和气道上皮细胞的编辑中。细菌收缩注射系统已被重新工程化,以允许蛋白质负载(包括基因组编辑器核酸酶)的瞬时和细胞特异性递送,具有高效率。模拟病毒但不含病毒遗传物质的工程化类病毒颗粒,已成为体内应用的病毒载体的强大替代方案。基于内源性病毒颗粒工程化的另一项有希望的技术,基于编码在真核基因组中的古老病毒,这可能允许以降低的免疫反应进行递送。最后,随着精确计算蛋白质设计方法的出现,正在开发从头设计的蛋白质笼,这可以提供模块化策略,将基因编辑器复合物递送到自然系统无法接近的生物环境中。尽管这些进展具有巨大前景,但需要在各种细胞类型和组织中严格评估这些技术的细胞毒性、脱靶和免疫原性谱。此外,其中一些方法用于临床应用的可扩展性构成了重大挑战,开发和制造此类复杂递送系统的成本也是如此。总体而言,迫切需要进一步研究以完善这些技术,确保其用于治疗的安全性和有效性。

人工智能

人工智能(AI)和深度学习计算算法最近在生物科学中的快速应用,也对基因组编辑领域产生了深远影响。通过对编辑结果和效率(包括脱靶活性)进行预测建模,它已经在提高其精确性和效率方面取得了相当大的进展——这对于最大限度地减少非预期遗传改变至关重要,特别是在安全性和有效性至关重要的治疗应用中。未来,AI方法可能用于进一步个性化治疗应用中的基因编辑方法。AI的力量还通过新型计算蛋白质设计方法,用于工程化新型、更高效和特异性的核酸酶。然而,AI方法也有其自身的一系列挑战。预测模型在很大程度上依赖于训练数据的可用性和质量,这可能受到实验方法的限制且高度可变。此外,AI模型的黑箱性质使得无法理解这些模型如何做出决策,从而难以解释和信任预测结果。尽管如此,AI在基因编辑中的潜在应用是巨大的,但在未来需要仔细考虑。

展望

在过去十年中,基因组编辑领域已从一项新兴的科学探索,转变为一种变革性的生物技术力量。主要基于内源性修复或位点特异性DSBs的第一代CRISPR技术,已得到第二代技术(如碱基编辑和引导编辑)的补充——这些技术能够在不产生DSB的情况下直接修饰靶标DNA,通常被认为更安全且产生更可预测的编辑结果。正在开发新兴的(第三代)CRISPR技术,以解决该领域的两个主要未满足需求:实现大(基因大小)负载的精确插入,以及通过表观基因组工程进行无任何基因组编辑的基因调控。这些技术和其他技术的持续进步,通过两种方法实现:一方面,通过挖掘宏基因组以发现新型分子系统;另一方面,通过合成生物学和(AI支持的)分子工程。

因此,基因组编辑的现状最好通过不断扩展的新型技术和方法来例证——这些技术和方法主要基于源自CRISPR-Cas系统的RNA引导的分子工具,彻底改变了我们精确、轻松地操纵遗传物质的能力。当前的发展轨迹表明,这些技术将继续得到完善,特异性、效率和递送机制将逐步提高。值得进一步研究的领域将包括开发更特异性和更低免疫原性的递送载体、减少脱靶效应、增强对编辑结果的控制,以及提高基因组编辑的准确性和精确性。展望未来,与纯基于蛋白质的技术相比,由于其简单的可编程性和适应性,核酸引导的系统可能仍然是基因组编辑的核心。然而,其应用模式可能会演变,可能转向更瞬时的编辑方法,以最大限度地减少非预期长期遗传改变的风险,或转向瞬时递送,以最大限度地减少基因组破坏和免疫反应。

由于第一代技术已通过体外编辑获批用于治疗SCDβ-地中海贫血等疾病,且体内方法也即将获批,因此限制未来针对多种疾病的基因组导向疗法发展的瓶颈,将不再必然是缺乏安全、高效或精确的基因组编辑器。主要挑战将在于递送方法,特别是对于血液和肝脏以外的器官以及体外的某些细胞类型。体内递送方法的进展(如mRNA疫苗开发中所见)可能会显著推动CRISPR技术的应用。此外,即使对于目前使用可用方法可编辑的组织和细胞,也需要更多的基础研究来识别安全的编辑靶标。因此,随着新递送载体的开发以及致病变体及其校正策略的表征,可通过CRISPR治疗的疾病范围将扩大。预计CRISPR领域以外的进展将帮助推动这些技术向新的方向发展,增强其能力。在这种情况下,基于AI的方法的兴起,将使我们能够准确模拟复杂的基因组编辑图景,预测在靶和脱靶编辑结果,并设计更强大的基因组编辑器,从而加快实施安全治疗方法的步伐。

伦理和社会影响,特别是关于人类生殖系基因组修饰,将仍然是基因组编辑讨论的前沿。随着人类体细胞编辑成为现实,治疗性和非治疗性生殖系编辑的前景(可能对人类基因组进行可遗传改变)引发了全球社会必须解决的深刻伦理问题。正如人类胚胎中的研究所示,CRISPR基因组编辑技术还不够安全或有效,无法用于生殖目的的生殖系编辑。此外,生殖系编辑的治疗效用有限,可能仅惠及少数个体。尽管如此,关于基因组编辑技术的治理和负责任管理的国际共识的紧迫性怎么强调都不为过,特别是考虑到其快速发展、持续改进和广泛采用。

总之,尽管存在现有挑战,但CRISPR基因组编辑的未来是光明的。它不仅有潜力推动研究突破和彻底改变人类医学,还有助于改善农业和应对生态挑战,从而为子孙后代奠定更健康、更可持续的未来基础。