揭秘:甲基化测序的酶促之旅

全基因组亚硫酸氢盐测序 (WGBS) 长期以来一直是甲基化组分析的金标准。亚硫酸氢盐测序依赖于将每个未甲基化的C转化为U(最终PCR显示为T),而甲基化的C最终还是读出为C

当前亚硫酸氢盐测序存在几个明确的局限性。完全的亚硫酸氢盐转化需要苛刻的条件,例如长反应时间和高温,这会造成严重的 DNA 损伤和降解。另一方面,C的化学转化可能不完全,特别是在高 GC DNA 区域或高度结构化的 DNA,如线粒体 DNA (mtDNA)

将未甲基化的C转化为T,从而去除文库中大部分C,导致基因组复杂度降低,对于测序和比对来说增加了挑战。

此外,长时间的亚硫酸氢盐处理会通过去嘧啶作用优先损害未甲基化C位点的 DNA,导致对甲基化水平的估计过高。还有,有限的4mC 的转化可能会对含有4mC的基因组产生假阳性。

开发亚硫酸氢盐测序的替代方案成为一个关注点。

之前发表的其他甲基化方法的讨论:

如果PCR扩增同时能保留甲基化状态...

如果能有效减少bisulfite甲基化测序时所造成的DNA降解...

我是建设者LIVE!LIFE!! OME!OME!!506篇原创内容公众号

无亚硫酸氢盐化学的酶促甲基化测序方法逐渐被开发出来。

2021年,NEB的科学家发表了酶促甲基化测序(EM-seq)的方法,之后NEB公司基于此推出了NEBNext Enzymatic Methyl-seq Kit,用于鉴定甲基化的5-mC5-hmC(但并不能区分这两种不同的修饰)。

EM-seq的基本思路就是通过酶转化方法来最大限度减少DNA损伤,以此来提高检测灵敏度。本质上,EM-seq方法得到的转化序列与WGBS是相同的。

虽然解决了DNA降解的问题,但这些无亚硫酸氢盐的 5mC 测序方法都包括额外的酶处理步骤,这可能导致最终的转化效率降低,增加了操作的复杂性和可能的批次间差异。

最近,Illumina推出了自己的5mC测序的解决方案5-base

不管是BS还是EM,甲基化的C都需要根据剩余的未转化的C进行推断。Illumina设想的是,是否可以在同一工作流程中同时检测这两种类型的碱基/变异。

llumina 5-base 解决方案的核心是一种新型的转化酶,选择性地将甲基化C直接转化为可用于测序的T。这一转化后得到的序列与之前的BS或者EM-seq是不太一样的。

酶促转化后,通过Illumina DRAGEN算法,可以在单次分析中完成甲基化感知基因组比对、甲基化定量和高精度变异检测。

当然,这个DRAGEN算法也是经过优化的,最主要的改进在于能够利用互补DNA链中编码的信息来区分到底这是甲基化的C还是发生了C>T的单碱基变异。对于甲基化的C,分析流程预期其互补碱基为G;而对于C>T变异,其互补碱基为A。而根据覆盖两条链的reads中包含的信息可以推断单个位置的C甲基化水平和变异等位基因频率。

在基准测试研究中,5-base转化方案提供的甲基化分析精度与金标准的BS-seq方法及EM-seq都相当。

基于甲基化和非甲基化pUCλ对照基因组的评估,5-base方法实现了甲基化C的高转化率和未甲基化C的极低脱靶转化率。

使用5-base转化方案测得的人类基因组CpG岛甲基化水平与EM-seq转化法获得的值高度一致。而5-base方案转化得到的序列具有高比对性,使得每个测序深度覆盖的CpG位点更多,意味着可以用更少的测序量实现同比高精度的甲基化谱分析。

5-base方案仅改变少量甲基化的C,因此可以保持整体文库的复杂性。这改善了读取比对,并允许在甲基化检测的同时进行准确的变异检出。这与BS转化和其他一些酶促方法(这些方法转化未甲基化的C)有着至关重要的区别。

传统的BSEM-seq需要两次单独的文库制备,需要对未处理的标准样本文库进行测序,通过两次测序的序列比对获取变异信息。如上所述,Illumina 5-base解决方案不需要两次单独的文库制备,可在同一测序reads中检测甲基化C以及所有四种碱基的变异。其DNA变异检测性能与标准 WGS 相当,也可以拿来检测低频变异。

总体上来看,Illumina5-base提供了一个可比且有竞争力的解决方案。

5-base解决方案开发的核心就是这个定制的5mC>T转化酶。

这是由 Illumina 内部改造的,经过多次迭代筛选,在数百万种蛋白质变体中最终筛选出的一种对甲基化胞嘧啶具有最高选择性和效率的蛋白质,使得反应仅需 30 分钟即可达到最佳效果。

这最终使得,与BS-seqEM-seqbiomodal6碱基制备和分析方案相比,Illumina 5-base解决方案可提供更短的周转时间。

寻找一种酶,或者改造一种酶,使得其能高效特异地转化特定甲基化碱基,以此能带来更高效直接的操作流程和更好的检测效果,这似乎是一个值得深入思考的方向,特别是在生成式AI这一工具快速发展的当下。

Illumina并未在公开的信息中提及所使用的独特酶的名称或基底。

NEBEM-seq需要多种已知酶,例如APOBEC3ATET2  T4-BGT,才能将未甲基化的C转化为U

但很显然,Illumina使用的应该是不同的酶...