实际上,最近几年我已经参与了若干物种的基因组学项目。我一直在思考:除了提供一批数据之外,我们的研究还能对实际生产产生怎样的推动作用?基因组组装和基因注释在整个育种研究中处于什么阶段?
我查阅了若干文献,在此简单综述:
植物育种的发展
中国科学院院士李家洋教授认为整个育种学发展经历了四个阶段【1】:
- 原始时期的 驯化育种;
- 遗传学诞生以后形成的 遗传育种,这阶段主要成就有杂交玉米/水稻/小麦等;
- 分子生物学的诞生推动形成的 分子育种
- 基因组学与设计生物学的兴起则产生了 设计育种。
详细可见李家洋教授的汇报视频: 分子设计育种的现状与未来
同时,还有其它角度的观点:
美国科学院院士Edward S. Buckler教授认为育种技术经历了四个版本的发展【2】:
v1.0 经验育种 -> v2.0 实验育种 -> v3.0 生物育种 -> v4.0 智能育种
中国科学院院士张启发教授提出 5G 育种概念【3】:
1G Genome + 2G Germplasm + 3G Genes + 4G Genomic breeding + 5G Gene editing
植物新品种的研究审定过程
- 确定核心性状
- 揭示分子机制
- 开发分子标记
- 杂交及分子设计聚合
- 田间生产实验
- 通过国家审定
植物育种策略
目前植物育种中,我认为李家洋院士团队提出的异源四倍体野生稻快速从头驯化的新策略最为完备【4】,整个驯化过程分为四步:
- 第一阶段,收集并筛选综合性状最佳的异源四倍体野生稻底盘种质资源;
- 第二阶段,建立野生稻快速从头驯化技术体系,其中包括三个核心点,即高质量参考基因组的绘制和基因功能注释,高效遗传转化体系,和高效基因组编辑技术体系;
- 第三阶段,品种分子设计与快速驯化,包括重要驯化和农艺性状基因注释及其品种分子设计,重要农艺性状基因的功能验证,多基因编辑及聚合,及田间综合性状评估;
- 第四阶段,新型水稻作物推广应用。
这个体系适用于主效基因的常规遗传改良策略,但是植物的许多重要性状都是由多基因控制的数量性状。控制性状的基因数目较多,但每个基因的效应较小,且基因之间、基因与环境之间存在复杂的互作关系。因此,适合主效基因的常规遗传改良策略,包括基因克隆和转移,很难直接用于微效多基因所控制的性状。可供选择的途径之一就是利用覆盖全基因组的分子标记去捕获分布在基因组不同区域的微效多基因座位及其所包含的遗传单倍型,从而通过标记辅助的选择将有利的等位基因及其单倍型聚合在一个目标个体中,实现复杂性状的遗传改良。聚合有利基因及其单倍型的分子育种策略之一就是基因组选择(genomic selection)【5】。
植物基因组选择
Genomic selection (GS) 是 marker-assisted breeding (MAB) 的一种,另一种是传统的分子标记辅助育种 marker-assisted selection (MAS)【6】。MSA仅对影响性状的数量性状位点数量较少的性状有效,而数量性状位点多的性状识别则效率很差。
基因组选择GS就是利用基因组上均匀的分子标记,通过对训练群体的基因型鉴定和表现型鉴定,根据基因型和表现型之间的关系,估计每个标记的效应,建立通过标记的基因型来预测表现型的遗传模型。所建立的遗传模型(包括标记效应)然后用于育种群体的表现型预测, 即根据育种群体的基因型,结合训练群体的标记及其单倍型效应,对育种群体的每个个体进行表现型预测,获得所有标记和单倍型效应的综合值——基因组育种值( genomic estimated breeding values; GEBV) 。与传统的分子标记辅助育种不同,基因组选择利用所有测试的标记(而不仅仅是统计学上对表现型有显著效应的标记)进行预测,因而可以捕获全基因组范围的相关遗传变异,从而提高选择效率。SNP就是比较理想的分子标记。
在植物中,不断更替的大量群体、复杂多变的外界环境、普遍存在的基因型和环境互作,增加了植物基因组选择的复杂性, 并因此受到很多限制因素的制约。改进基因组预测准确性成为主要命题,而其中围绕分子标记和育种群体的研究仍旧是重中之重。
国际玉米小麦研究中心的徐云碧博士的两篇文章 《Enhancing genetic gain through genomic selection: from livestock to plants》和 《Enhancing genetic gain through genomic selection: from livestock to plants》 分别发表于 2021年与2008年,两篇文章读下来,植物育种学的前世今生及未来都变得清晰无比,强烈推荐。中文梗概可看Plant Com | 植物基因组选择育种:从理论到实践的跨越。
植物基因组辅助育种
需要注意的是,基因组选择(Genomic Selection; GS)和 基因组辅助育种 (Genomics-Assisted Breeding; GAB)是两个概念, GS是GAB的一部分。
基因组辅助育种 (Genomics-Assisted Breeding; GAB)【7】【8】是建立在一系列技术发展基础之上的,包括 重要数量性状位点的大规模定位、基因克隆鉴定与编辑、关键等位基因/单倍型的挖掘、自然变异的开发和基因组选择等等。
在近十年间, 植物基因组辅助育种得到了巨大的发展,已经由GAB v1.0 迈入了GAB v2.0时代。GAB v2.0 提出了一种整体方法,旨在积累植物基因组中的有利等位基因或清除有害等位基因,以实现人工设计未来的作物。分为八个模块:
- (A) Germplasm collections archived in gene banks provide both superior (beneficial) and deleterious effect (harmful) alleles.
- (B) High-throughput sequencing in combination with multi-omics assays and field phenotyping provides a powerful means to connect genomic variations with the important phenotypes.
- (C) Once a gene-trait association is identified, functional validation leads to a causative gene.
- (D) Information about the causative genes affecting key plant traits paves the way for haplotype-based breeding/genomic breeding or de novo domestication.
- (E) In parallel, genomic prediction approach based on genome-wide genotyping information can also be used to make informed decisions in breeding programs.
- (F) Methods like optimal contribution selection (OCS) that maintain a balance between the rate of genetic gain and genetic diversity/inbreeding will be crucial for prebreeding and breeding purposes.
- (G) Speed breeding will help expedite crop breeding progress. (H) Implementation of these new breeding tools and approaches will help in accumulating beneficial alleles or purging harmful alleles in breeding population and improving genetic gains of breeding program.
目之所及就能发现,整个育种研究方向庞大无比,而在整个系统中,基因组学处于基石的位置,至关重要!
围绕植物育种研究各个环节的问题,学界目前发展出了一系列的技术与方案,以期用模型化,流程化及智能化的方案取代人工决策,且必将成为主流。由于体系的完善与成本的降低,惠及的研究物种将大大增多,有且不仅限于模式物种,包括柑橘属, 大豆, 玉米等等。
遗憾的是,除了科研端我们经常可以看到中国科学家的阶段成果,但在资本端、产业端、监管端我们很少听到中国的声音。