2025年6月26日,崖州湾国家实验室/中国农业科学院作物科学研究所李立会老师团队bioRxiv发表了题为Agropyron cristatum genome provides a new insight for wheat improvementwith wild relatives的研究论文。挖掘目标性状的新遗传变异对推进小麦育种及遗传改良至关重要。自1990 年以来,李立会老师团队通过远缘杂交,将冰草(Agropyron cristatum)——一种极具潜力的野生近缘种遗传资源,其具有稳健的穗部形态和抗逆性—— 的基因导入普通小麦。为高效利用冰草基因,该研究从头组装了同源四倍体材料Z559(含28 条染色体)的高质量基因组,大小为25.62 Gb,并揭示了其独特的基因组特征及大量与产量和非生物、生物胁迫抗性相关的基因。通过对431 份小麦- 冰草衍生系进行重测序,系统鉴定了冰草基因组渐渗片段,并克隆了基因AcGNS1,该基因参与调控小麦每穗粒数。随后,为小麦 – 冰草育种衍生系开发了优化的基因组选择模型,可快速筛选具有潜力的新品种。这些发现为利用野生近缘种的新遗传资源、推进小麦改良提供了一种基因组育种策略。

引言
普通小麦(Triticum aestivum L.)是新石器时代在新月沃地驯化的农业奠基作物之一。如今,它是世界上种植最广泛的作物,提供人类20% 的热量摄入。为满足人口增长和粮食消费增加的需求,以及适应气候变化,持续改良小麦的籽粒产量及对生物和非生物胁迫的抗性至关重要。然而,小麦遗传多样性狭窄,严重限制了培育具有显著提高的产量潜力或能适应未来气候与农艺挑战的品种的能力。小麦野生近缘种的利用在培育新型小麦品种中发挥了关键作用。进一步发掘和转移野生近缘种中的有利基因,对拓宽小麦遗传基础、加速育种及遗传改良具有重要意义。

冰草属(AgropyronGaertn.)是小麦族中含基因组的一个属。冰草(A. cristatum)是该属的模式种,在世界多个国家被广泛种植为优质牧草。更重要的是,其独特的穗部形态—— 每穗含30-48 个小穗,每小穗含6-12 朵小花——加之优良的株型及对生物和非生物胁迫的强抗性,使其成为种间杂交小麦育种中极具潜力的供体。20世纪30 年代就已开始尝试将冰草的性状渐渗到小麦中,但早期尝试均未成功。1990年,李立会老师将普通小麦品种“Fukuho”FukuhokomugiFukuho)与来自中国新疆戈壁沙漠的四倍体冰草材料Z5592n=4x=28PPPP)成功杂交,取得了突破性进展。这一成果开启了冰草分子细胞遗传学和表型分析的广泛研究新阶段,培育出了多种小麦– 冰草衍生系,包括附加系、易位系以及细胞学上无法检测的隐性渐渗系。这些衍生系表现出优良的农艺性状,凸显了其在小麦改良中的巨大潜力。

为有效利用冰草基因进行小麦品种改良,作者利用PacBio HiFi 测序读长组装了四倍体冰草材料Z559 的高质量基因组,揭示了其关键基因组特征及重要农艺性状相关的基因库。通过结合冰草参考基因组对134 份小麦– 冰草附加系和易位系进行遗传分析,作者解析了每个品系中渐渗的基因组成分,并从该野生种中快速鉴定并克隆了一个关键基因AcGNS1,该基因参与调控小麦每小穗粒数。利用 297 份育种衍生系的渐渗片段信息和 SNP 变异,作者开发了一种预测性育种选择模型,可加速高稳产候选品种的筛选。本研究凸显了冰草渐渗片段在小麦育种中的变革性潜力。

结果
基因组组装、验证与注释
基于k-mer 分析,冰草材料Z559 的基因组大小估计约为24.40 Gb,几乎是二倍体冰草1C 基因组大小(6,352 Mb)的倍,杂合率为1.85%(图1a)。鉴于其高杂合率及复杂的四倍体基因组特征,作者生成了约624.41 Gb30×)的PacBio HiFi 读长(N5016.29 kb)和1,537 Gb60×)的Hi-C 读长。首先,利用Hifiasm组装Z559 基因组,得到25.62 Gb contigcontig N50 26.22 Mb。随后,通过ALLHiC整合51 亿对Hi-C 数据读长进行四倍体基因组的scaffold构建,成功将24.37 Gb95.12%)的contig 锚定到28 条假染色体上,这些假染色体包含个同源群(HGs),每个同源群含条单倍型染色体(图1b)。

为评估Z559 基因组组装的完整性和准确性,作者首先将1.10 Tb Illumina 短读长比对到组装的基因组上。比对率达99.31%,核苷酸准确率接近100%,基于k-mer 的共识质量值(QV)为41.81,表明Z559 基因组的组装准确性较高。此外,作者采用单拷贝直系同源基因评估(BUSCO)方法评估基因完整性。结果显示,其个假单倍体基因组(每个含条染色体)的BUSCO 完整性分别为97.70%97.40%97.30%96.50%,综合得分为98.70%。长末端重复序列(LTR)组装指数(LAI)达22.96,是已报道的小麦族基因组中最高的。通过对着丝粒特异性组蛋白H3 类似蛋白(CENH3)的染色质免疫共沉淀测序(ChIP-seq)分析,进一步证实功能性着丝粒区域已连续组装,无序列缺口(图1b)。所有这些结果均表明,冰草Z559 基因组的组装质量较高。

通过整合RNA 测序和全长转录组测序读长比对结果,结合从头预测和基于蛋白质同源性的预测,作者在冰草Z559 基因组的个单倍型中注释到171,519 个高置信度(HC)蛋白质编码基因模型。整体BUSCO 完整性得分为97.5%(在1,614 个胚胎植物单拷贝直系同源基因中覆盖1,574 个),表明预测的基因模型质量较高。此外,作者注释到基因组中86.81% 为转座元件(TEs)。其中,长末端重复反转录转座子(LTR-RTs)最为丰富,约占基因组的76.37%。在这些LTR-RTs 中,GypsyCopia 是两个主要家族,分别占基因组的50.18% 18.23%。与先前报道的小麦族基因组类似,冰草Z559 基因组中的基因、转座元件、转录本及表达广度在染色体上的分布并不均匀。沿著丝粒– 端粒轴,两条染色体臂上的基因和转录本密度逐渐增加,而转座元件和表达广度则呈现相反模式,这与到着丝粒的距离相关(图1b)。

四倍体冰草基因组的特征
在高置信度(HC)基因模型中,40,445个等位基因被明确界定,其中29,129 个(72.02%)存在于所有四个单倍型基因组中(四拷贝)(图1c),其余等位基因则存在于三个(三拷贝,4,423个,10.94%)、两个(双拷贝,2,298个,5.68%)或一个单倍型基因组中(单拷贝,4,595个,11.36%),这表明四个单倍型基因组间存在丰富的等位基因存在缺失变异。此外,利用经等位基因界定的基因模型,鉴定出3,194 个串联(连续)重复和18,151 个散在重复,揭示了广泛的等位基因拷贝数变异。在Z559 基因组中,每个基因平均有3.44 个拷贝和3.18 个不同的等位基因(图1c)。

为探究冰草多倍体基因组内的分化情况,作者首先比较了四个单倍型染色体间等位基因对的编码序列(CDS)。分析显示,CDS相似性高达99.4%,且各染色体对应片段间无显著差异(P> 0.05)。系统发育分析表明,冰草的四条同源染色体具有共同起源。以小麦亚基因组和大麦基因组为参考,作者进一步评估了直系同源基因的Ka:Ks 比值,发现各染色体对应片段间无显著差异(P> 0.05)。这些结果表明,冰草的四个单倍型基因组受到对称性纯化选择。

共线性分析也显示,各染色体间的结构分化极小(图1b)。基因表达分析显示,同源染色体间的整体表达水平相似,表明不存在显著的基因组显性。通过对同源多倍体和异源多倍体的单倍体基因组间共线性基因对的比较分析,冰草被明确归入同源多倍体类群,在所有分析的同源多倍体中,其平均Ks 值最低,序列一致性最高(约99%)。这些发现提供了有力的基因组证据,支持冰草基因组为单一起源,解决了此前基于细胞遗传学数据推测的关于其为同源多倍体还是异源多倍体的长期争议。

1:冰草Z559 的形态特征及基因组概述

P基因组进化
为阐明小麦族中冰草基因组的进化轨迹,作者利用禾本科14 个基因组亚基因组的1928 个单拷贝直系同源基因进行了系统发育分析。结果表明,冰草与二倍体小麦的分化发生在大麦分化之后,但早于黑麦和长穗偃麦草与小麦的分化(图2a)。直系同源基因对的Ks 分布显示,冰草与小麦从其最近共同祖先(MRCA)分化的时间约为880~902 万年前,而冰草的四倍体化发生在95 万年前。

在宏观进化水平上,染色体重排在真核生物物种形成中发挥重要作用。冰草、黑麦、大麦和小麦的基因共线性图谱显示出广泛的基因组共线性。然而,与小麦、黑麦和大麦的染色体相比,作者发现冰草不同染色体中存在大量结构重排。例如,4P2P 染色体的形成经历了染色体断裂、易位和融合(图2b)。

冰草基因组的转座元件组成
长末端重复反转录转座子(LTR-RTs)是大多数植物基因组中占比最大的成分,在塑造基因组结构和功能中发挥重要作用³⁸。在冰草基因组中,24个全长LTR-RT 家族(如Deramin Nusif)发生了显著扩张(图2b)。这些LTR-RT 家族在过去约200 万年间在冰草基因组中持续扩张,而在对照基因组(如大麦、黑麦、长穗偃麦草和小麦)中,这些家族要么不存在,要么仅表现出偶发且有限的活性(图2b)。这些LTR-RTs 的持续扩增解释了冰草基因组中观察到的长期反转录转座子爆发。

某些LTR-RT 家族(如Daniela Nusif)在端粒周围区域的丰度始终低于其他染色体区域(图2b)。有趣的是,在2P 4P 染色体的结构重排融合区域也观察到了类似的稀缺性(图2b)。这些结果表明,冰草基因组中Daniela Nusif 的爆发具有保守的扩张偏好,因为2P 4P 染色体的融合区域在重排前原本位于端粒周围区域(图2b)。

LTR-RTs是着丝粒的主要成分,对着丝粒在细胞分裂中维持染色体完整性至关重要。功能性着丝粒的定义是组蛋白H3 被表观遗传替换为CENH3。通过CENH3 ChIP-seq 分析,作者在冰草Z559 基因组的每条染色体上都鉴定出了与功能性着丝粒对应的独特高覆盖区域。着丝粒长度范围从1P_4 染色体上的5.5 Mb 5P_4 染色体上的10.5 Mb,平均为7.5 Mb。与小麦和一粒小麦不同(其着丝粒区域以Gypsy 家族元件Cereba(约70%)和Quinta(约20%)为主),冰草基因组的着丝粒区域呈现独特的组成模式:约40% unnamedfam6 元件,20%Abia 元件(图2c)。此外,作者扩增出一段871 bp 的序列,该序列与冰草的unnamedfam6 元件部分同源,通过荧光原位杂交(FISH)可将基因组与其他小麦族基因组明确区分。这些发现凸显了基因组着丝粒的独特特征,为理解着丝粒功能的进化机制提供了有价值的见解。

2:冰草Z559 基因组的特征

冰草基因组中重要农艺性状基因家族的扩张
发生显著改变的基因可能在物种形成中发挥重要作用,并可能部分解释其表型分化。作者对冰草、黑麦、长穗偃麦草和小麦的基因家族进行了全面比较,鉴定出2335 个冰草特异性基因家族(包含8025 个基因)。功能富集分析显示,这些特异性基因显著富集于关键的GO术语(如离子通道活性、离子转运、酶抑制剂活性),以及与植物– 病原体互作、光合作用和次生代谢物生物合成相关的KEGG通路。

随后,作者在冰草中鉴定出2511 个快速扩张的基因家族(包含56383 个基因)。这些快速扩张基因的性状本体(TO)分析表明,它们主要与重要农艺性状相关,包括抗性、根深度、单株粒数和每穗小穗数。例如,SPL14基因参与水稻产量调控和稻瘟病抗性,在普通小麦的ABD亚基因组、黑麦的基因组和长穗偃麦草的基因组中均仅含个拷贝,而在冰草7P 染色体的个单倍型中分别含167310 个拷贝。DREB1C基因在水稻中过表达时,因每穗粒数、粒重和收获指数增加,产量比野生型高41.3% 68.3%;该基因在冰草7P 染色体的个单倍型中扩张至4-8 个拷贝,而在ABDR基因组中仅含1-4 个拷贝。

其他关键例子包括:源自长穗偃麦草的主要赤霉病抗性基因Fhb7 ABD基因组中无直系同源基因,但在冰草的7P_17P_43P_1 染色体上分别检测到52个拷贝。在非生物胁迫耐受性方面,CBF是冷信号感知和响应通路的关键成分。除了冰草第同源群(HG 5)上与Fr2 同源位点的CBF 基因簇外,作者还在1P 2P 染色体上发现了另一个基因组特异性的CBF 相关基因簇。

此外,在冰草Z559 基因组中鉴定出696 个受自然正选择的基因,如COLD1LG1SPY。值得注意的是,这些正选择基因主要富集于与关键农艺性状相关的TO 术语,包括开花期、单株籽粒产量、根数、株高、小穗育性和每穗粒数。

bioRxiv | 冰草基因组为利用野生近缘种改良小麦提供了新见解

所有这些结果表明,这些基因的扩张可能为冰草所表现出的诸多优良性状提供遗传基础,并有助于指导该野生种在小麦改良中的应用。

利用组装的冰草基因组分析小麦– 冰草附加系和易位系
异源附加系和易位系是渐渗育种中的重要中间材料,可作为拓宽作物遗传多样性的供体。利用组装的冰草基因组,作者明确了134 份由普通小麦品种“Fukuho” 与冰草材料Z559 杂交产生的材料中来自冰草的渐渗遗传成分,包括46 份整染色体附加系、17份部分染色体附加系和71 份易位系(图3a)。在这些材料中共鉴定出143 个冰草渐渗染色体片段,涵盖45753 个非冗余基因,包括2125 个冰草特异性基因。

作为代表性例子,含6P 染色体的附加系4844-12 表现出每穗粒数(GNS)和千粒重(TGW)显著增加,同时增强了对多种病害的抗性。利用该品系,作者培育了份部分染色体附加系和26 份易位系用于小麦改良。借助冰草的基因组组装和注释,作者检测到4844-12 品系中附加了冰草的6P_1 染色体。该附加的6P_1 染色体含5541 个高置信度基因,以及686 个已知功能基因的同源基因。在这条染色体上鉴定出一组产量相关基因,包括136 个粒数相关同源基因和67 个粒重相关同源基因(如RFT1LRK1D1GW6aGW2)。此外,还在该染色体上鉴定出510 个抗病相关同源基因(如Pi21Pm21Pm2Xa21Lr13)以及181 个非生物胁迫耐受性相关同源基因。

在源自4844-12 份部分染色体附加系中,del19a2n=44)和del262n=44)两个品系(图3a)与受体品种“Fukuho” 相比,每穗粒数(GNS)和每小穗粒数(GNPS)显著增加(图3c)。值得注意的是,del26GNS GNPS 增幅大于del19a(图3c)。基因组分析显示,del19a携带冰草6P_1 染色体330.56–822.57 Mb 区域的492.01 Mb 片段,而del26 则含6P_1 染色体307.60–822.57 Mb 区域的稍大片段(514.97 Mb)(图3d)。两个品系的附加染色体差异在于一个22.96 Mb 的区域(6P_1染色体:307.60–330.56 Mb),这表明该区间可能含有控制GNS GNPS 的基因。在该22.96 Mb 区域内,注释到53 个高置信度基因。为鉴定并克隆相关基因,作者对del26 的根、茎、叶和幼穗等组织进行了RNA-seq 分析,发现该22.96 Mb 区域中有26 个基因在幼穗组织中表达,其中仅个在双棱期和小穗分化关键发育阶段高表达(图3e)。在这个基因中,仅Ac6P01G276100有功能注释,与拟南芥的SWI3B同源(该基因参与早期胚胎发育)。因此,作者将Ac6P01G276100视为影响GNS GNPS 的候选基因,并命名为AcGNS1

为验证AcGNS1在调控籽粒性状中的作用,作者在普通小麦品种“Fielder” 中过表达该基因。T3AcGNS1表达的转基因株系表现出每小穗粒数显著增加(0.36粒,P<0.05)和每穗粒数显著增加(5.02粒,P<0.01)(图3f g),单株籽粒产量因此提高18.09%P<0.05;图3g)。这些结果证实,冰草的AcGNS1 在小麦中表达确实能增加每小穗粒数和每穗粒数,进而提高籽粒产量。

总体而言,作者对通过远缘杂交培育的这些附加系和易位系的重测序分析,有助于阐明这些材料中基因组的遗传组成,并表明这些材料是新的遗传资源,含有大量冰草的有利基因,可用于培育高产、抗病和耐非生物胁迫的未来小麦品种。
 

3:小麦– 冰草附加系和易位系的遗传分析

利用组装的冰草基因组分析小麦– 冰草育种衍生系
1990 年以来,李立会老师通过普通小麦“Fukuho” 与冰草Z559 的属间杂交,再与“Fukuho” 及其他主栽品种多代回交,并结合目标性状的人工选择,培育了297 份育种衍生系。2021–2022生长季,作者在河南新乡以实际生产密度进行小区种植,对141 份育种衍生系的个产量相关性状(单位面积产量、千粒重、单位面积穗数、每穗粒数、每穗小穗数和每穗总不育小穗数)进行了表型调查。这些衍生系的产量范围为7912.84 kg/ha 11917.19 kg/ha,平均产量为10372.78 kg/ha。在141 份衍生系中,124份(87.94%)的产量高于当地主栽品种周麦18”9517.25 kg/ha),66份(46.81%)的产量比其高10% 以上。因此,这些衍生系在田间表现出优异的产量性能,显著优于当地对照品种。

作者采用基于k-mer 的方法检测了所有297 份育种衍生系中来自冰草的基因组渐渗片段(见方法)。在所有衍生系中,共鉴定出107779 个来自冰草的渐渗片段,累计大小为13.88 Gb,其中996 个为非冗余渐渗片段(图4a)。单个渐渗片段的大小范围为50.00 kb 1.25 Mb,平均为104.70 kb。每个衍生系含131 500 个渐渗片段,平均363 个(图4a)。渐渗片段总长度最大的品系是小区336,累计渐渗大小为62.83 Mb。有趣的是,作者发现渐渗片段在小麦基因组中的分布不均匀,且来自冰草染色体臂的渐渗片段多于着丝粒区域(图4a)。在996 个非冗余渐渗片段中,351个(35.24%)含蛋白质编码基因。富集分析显示,渐渗基因显著富集于GO 术语(如蛋白质糖基化、酶抑制剂活性)、KEGG通路(如角质、木栓质和蜡生物合成)以及TO 术语(如单株籽粒产量、单株粒数和一次分枝数等)。

为评估冰草渐渗对产量相关性状的贡献,作者使用连锁不平衡调整亲缘关系(LDAK)模型(见方法)对这些表型鉴定的育种衍生系进行分析,估计遗传变异(包括冰草渐渗多态性和小麦单核苷酸多态性(SNP))解释的表型方差。不纳入渐渗信息时(即仅用SNP),6个性状的遗传力值范围为0.71 0.74(图4b)。相比之下,纳入渐渗多态性信息后,产量性状的遗传力显著提高(增幅9.7%),6个性状的平均增幅为4.6%(图4b)。

作者进一步利用这些表型鉴定的衍生系作为训练群体开发基因组选择(GS)模型,以预测农艺性状,旨在从297 份育种衍生系中快速筛选候选品种或品系用于生产。当仅使用性状关联SNP 标记(见方法)时,6个农艺性状的平均预测准确率范围为0.558 0.822。然而,将渐渗片段标记纳入模型后,千粒重的预测准确率提升最大(达41.3%),6个评估性状的平均增幅为14.6%(图4c),这表明来自冰草的渐渗片段对籽粒产量形成有积极作用。为筛选出最具潜力成为新品种的衍生系,作者使用优化的产量GS 模型预测了所有297 份衍生系的基因组估计育种值(GEBVs)。如图4d 所示,含390 个渐渗片段的小麦– 冰草育种衍生系小区224297 份衍生系中产量GEBV 最高。

随后,作者根据《中国小麦新品种试验规范》,于2022–2023 生长季在黄淮南部地区23 个试点、2023–2024生长季在17 个试点对该衍生系小区224(更名为普冰资300”)进行了国家区域试验(图4e f)。普冰资300” 表现优异,两季平均产量分别为8005.5 kg/ha 8948.3 kg/ha,分别比对照品种周麦36” 增产5.86% 7.84%(中国新品种审定标准要求产量至少比对照高3%)。2022–2023季苏州试点的最高增幅达16.77%2023–2024季许昌试点达18.71%。值得注意的是,普冰资300” 在不同环境条件下表现稳定,在2023–2024 19 个候选品种中,其在17 个试点的平均产量排名第一(图4g)。这些结果凸显了普冰资300” 作为高产、广适小麦品种的潜力,并进一步证实了冰草渐渗对提高小麦产量的贡献。

4:在小麦– 冰草育种衍生系中开发的基因组选择模型加速优良小麦品种培育

讨论
利用野生近缘种的遗传多样性仍是克服现代作物育种中遗传限制的有效策略。然而,由于传统远缘杂交存在杂交成功率低、不育性高、连锁累赘、重组受抑制以及育种周期漫长等挑战,从野生近缘种中鉴定和利用重要农艺性状基因是一项艰巨的任务。本研究中,作者成功组装了冰草(P基因组)的高质量基因组—— 该野生供体种用于作者的小麦改良远缘杂交项目,并对431 份小麦– 冰草衍生系进行了重测序。这些基因组序列资源结合预测的基因模型,为精确鉴定来自冰草的渐渗片段和基因提供了平台,也为通过标记辅助选择加速利用冰草基因推进小麦改良提供了强有力的框架。该序列资源还为鉴定潜在的功能基因或调控序列开辟了道路,这些基因或序列可通过基因转化和基因组编辑手段用于小麦乃至其他作物的改良。

比较基因组分析揭示了某些LTR-RT 家族的谱系特异性扩张、独特的着丝粒转座元件组成以及染色体重排,凸显了冰草基因组在小麦族中的进化独特性。重要的是,与穗发育和胁迫响应相关的基因家族扩张表明,冰草具有现代小麦所不具备的宝贵农艺潜力。

通过将该基因组与小麦– 冰草衍生系的重测序数据整合,作者发现这些材料不仅含有其优良农艺性状背后的功能基因,还含有大量小麦中不存在的新基因,这些基因与生产力提高、抗病性和非生物胁迫耐受性相关。这些异源基因稳定整合到小麦基因组中,显著拓宽了现代小麦的遗传基础。

值得注意的是,作者的组装区分了四倍体冰草的四个单倍体基因组,能够对渐渗片段进行单倍型特异性追踪。然而,其代表性存在固有局限。因此,冰草泛基因组对于捕捉更广泛的单倍型多样性和充分挖掘该物种的潜力至关重要。

总之,本研究不仅提供了冰草的基础性基因组资源,还提出了利用野生种质的合理育种框架。将渐渗片段与功能变异关联的能力为性状改良(包括基因组编辑)开辟了新途径,且这些策略可应用于其他作物。

扩展数据图展示小麦与冰草远缘杂交及后续小麦– 冰草衍生系创制过程的流程图

声明:

1、本公众号所发布的内容,包括但不限于文章、图片、视频等,均为课题组成员基于学术研究和学习目的而进行的解读和分享,不代表任何官方立场。

2、作者尊重原创,所有内容均来源于公开发表的学术文献。如有侵权或不妥之处,请及时与作者联系,作者将立即更正或删除。

3、本公众号所提供的信息仅供参考和学习之用,不构成任何形式的专业建议或指导。对于因使用本公众号内容而产生的任何直接或间接损失,作者不承担任何责任。