最近看到李家洋院士团队2021年在《cell》发表的这篇文章A route to de novo domesticationof wild allotetraploid rice,感觉很有意思,另外这篇文章引用不少参考文献似乎对我的课题很有用,可以看看。不得不感叹,这篇文章涉及到的知识面之广,工作量之大。https://hub.pubmedplus.com/10.1016/j.cell.2021.01.013
之前一些研究主要是将作物野生祖先的一些优良基因导入到现代作物中,企图恢复作物驯化过程中丢失的基因。这篇研究改变思路,提出从野生稻开始从头驯化的育种策略,在基因编辑以及测序手段没有成熟之前,这项工作是不敢想象的,然而,近年来生物学技术的突破突飞猛进,尤其是CRISPR/Cas9技术在各个模式生物中的普及,给从头驯化提供了可能。
以下是文章正文:
栽培水稻品种都是二倍体,水稻多倍体化因其在基因组适应力和环境稳健性方面的优势而一直受到人们的关注。然而,可行的研究路线仍然没有被开发出来。在这里,我们描述了一种实用的研究策略,即从头驯化野生异源四倍体水稻。通过筛选异源四倍体野生稻库,我们确定了一个基因型 Oryza alta (CCDD)、多倍体水稻 1 (PPR1),并为其从头驯化建立了两个重要资源:(1) 高效的组织培养、转化和基因组编辑系统(2) 高质量的基因组组装,两个各自含有12 条染色体的亚基因组。在这项研究中,利用这些资源,通过编辑控制二倍体水稻中这些性状的基因的O. alta 同源物,可以迅速改善六种重要的农艺性状。我们的研究结果表明,从头驯化的异源四倍体水稻有可能被开发成一种新的谷物,以加强世界粮食安全。
Introduction:
多倍体化由全基因组复制或种间杂交产生,是开花植物的一种常见进化模式,多倍体植物往往在生物量、生长活力和对环境变化的适应性方面具有显著优势。所以这篇文章的作者认为多倍体作物作为可以作为未来应对全球气温升高,灾害加剧等环境变化的手段。
现代栽培稻由祖先野生二倍体水稻Oryza rufipogon驯化而来,在驯化过程中,各种重要的农艺性状被作为选择标准,包括种子落粒、直立植株构型、穗形、芒长、颗粒大小和品质、壳色等。由于二倍体水稻的基因组简单和转化系统搞笑,作为模式生物在诸多农艺性状的研究已经非常深入,许多成果已经用于育种。曾经有研究者提出栽培稻进行多倍体化,但问题是他们的遗传背景有限。
迄今为止,已鉴定出27种水稻属植物,并划分为11个不同的基因组类型,包括6个二倍体(AA、BB、CC、EE、FF和GG)和5个异源四倍体(BBCC、CCDD、HHJJ、HHKK和KKLL)。其中,来自南美的具有CCDD基因组的物种比栽培的二倍体水稻具有更大的生物量和更强的生物和非生物抗性。带有CCDD基因组的异源四倍体水稻起源于一次杂交事件,以CC基因组种为母本,以DD基因组型为父供体的已灭绝种(O. australiensis, EE基因组型是DD现存的近亲属)。由于缺乏参考基因组以及转化和再生困难,对异源四倍体水稻的研究在很大程度上落后于研究良好的具有AA基因组的二倍体水稻品种。
传统的将野生植物驯化为良好作物通常需要数百年甚至数千年的时间,但最近发展的基因组编辑技术使这一目标在几代人的时间内实现成为可能。因此,迫切需要高效的基因组编辑系统来加快驯化的步伐。农杆菌介导的转化系统仅在水稻亚种粳稻和籼稻中得到了有效的发展;然而,在O. glaberrima和具有AA基因组的野生稻中,转化效率仍然很低。对于异源四倍体野生稻来说,它们的转化仍然是个不小的挑战,尽管其中一些可以以极低的速率再生。
在这里,我们通过筛选野生异源四倍体水稻库,建立有效的转化和基因组编辑系统,组装高质量的注释,描述了从头驯化和改良野生稻相对异源四倍体O. alta (CCDD) 的途径。24 条染色体阐明了异源四倍体水稻基因组的遗传蓝图和进化史,以及基于二倍体水稻知识的驯化相关基因和农艺学重要基因的基因组编辑。我们的工作为创造新作物以满足未来粮食需求提供了实用策略。
2 Results:
2.1野生异源四倍体水稻的从头驯化路线图:为了培育多倍体水稻作物,我们开发了一个从头驯化路线图,即重新驯化野生异源四倍体水稻(图1A)。整个驯化过程可分为四个步骤:第一步,选择合适的起始材料进行新生驯化;第二步,建立理想的技术体系,包括参考基因组、基因的功能注释,以及高效的转化和基因组编辑系统;第三步,对驯化相关基因或等位基因进行多重基因组编辑,设计并快速导入,然后进行田间评价;第四步,新作物的认证和推广。然而,野生异源四倍体水稻既没有合适的起始材料,缺乏必要的技术体系。
2.2异源四倍体O. alta基因型PPR1转化体系的建立:
为了确定最有希望的起始材料,我们认为愈伤组织的诱导和再生能力是最重要的属性,其次是合适的生物量特性和对非生物和生物胁迫的抗性。因此,我们从种质资源库中收集了28个具有CCDD基因组的株系,包括8个alta株系、2个grandiglumis株系和18个latifolia株系,并利用二倍体水稻的典型方法测试了它们的愈伤组织诱导和再生能力。
我们发现一些品系具有适度的愈伤组织诱导能力,但大多数品系的再生率非常低,除了一种基因型 O. alta(来自中国南宁野生稻种质资源国家苗圃的登录号 2007-24),其在愈伤组织诱导和再生方面表现良好(图 S1A;表 S1)。在此基础上,我们优化了方案,最终实现了一个令人满意的转化系统,转化效率为 80%,再生能力为 40%(图 S1B-S1E)。因此,我们认为该材料可作为进一步进行重新驯化研究的模型,并将其命名为多倍体水稻1 (PPR1) 重要的是,PPR1 的杂合率也很低(<0.2%)(图 S2A),这对基因组测序和组装是一个有利的特征。虽然它的生物量比栽培水稻大得多,但它具有典型的非驯化特征,例如高度 > 2.7 m(图 1B)、宽而长的叶子(图 1C)、穗长 > 48 cm,小穗稀疏(图 1D)和小粒度(千粒重 8.79 克),芒 > 4 厘米(图 1E)。综上所述,我们选择PPR1作为从头驯化的起始模型材料,建立了高效的PPR1的组织培养和转化体系,从而克服了从头驯化过程中最大的障碍之一。
2.3组装高质量的PPR1基因组和同源亚基因组
第二个挑战是组装高质量的PPR1 基因组。我们通过生成 121.1 Gb (123.42X) 的单分子实时测序数据、287.1 Gb (292.62X) 的 BioNano 数据、103.2 Gb (105.18X) 的高通量染色质构象捕获来采用集成的基因组测序和组装方法 (Hi-C) 数据和 85.2 Gb (86.79X) Illumina 短读长(图 S2B 和 S2C),并实现了包含 24 条假设染色体的高质量组装,其中片段重叠 N50 为 18.2 Mb,超级脚手架(super scaffold)N50 为 37.1 Mb(PPR1 V1.0)(表 1),总基因组大小为 894.6 Mb(876.4 Mb 锚定在染色体上)。然后,我们通过为 10 个代表性组织生成 235 Gb 的 RNA 测序 (RNA-seq) 数据构建了一个基因表达图谱,其对 PPR1 V1.0 的平均映射率为 92.81%(图 S3A 和 S3B)。在来自转录组测序的 482,997 个转录本中,90.16% 在 PPR1 V1.0 中检测到,具有超过 99% 的同一性(图 S3C)。最后,预测和功能注释了 99312 个蛋白质编码基因,包括 81421 个高置信度和 17891 个低置信度基因,平均长度为 3021 bp(图 S3D 和 S3E)。此外,我们注释了 1253 个假基因和 17104 个非编码 RNA,包括 12,332 个 microRNA,2032个RNAs, 1147个tRNAs, 207个小核RNA (snRNAs), 1057个小核仁RNA(snoRNAs), 10个信号识别颗粒RNA (srpRNAs),和319个其他非编码RNA(ncRNAs)(表S2)。在预测的蛋白编码基因中,99.94%不均匀地分布在24条染色体上,末端基因较多(图1F)。我们发现,BenchmarkingUniversal Single-Copy Orthologs (BUSCO)基因集中98.2%的完整基因被收集,显示了基因组装配的高准确性和完整性。
2.4异源四倍体O. alta的基因组特征
为了探索 O.
alta 和O. sativa 之间的基因相似性,我们比较了PPR1 HC 基因(81,839 个基因)和Nipponbare MSU 基因组(55986 个基因),发现日本晴的 43599 个(77.87%)基因在O. alta 中有同源物,包括在 Ct 和 Dt 亚基因组上具有同源基因的 39,543 个(70.41%)基因(图 2A)。同时,我们发现在栽培的二倍体水稻中,O. alta 的 Ct 和 Dt 亚基因组上的 10,862 和 9,982 个基因没有发现同源物,这可能是因为一些基因在进化中同源高度分化的。由于O. alta 表现出强烈的生物和非生物抗性表型,我们进一步鉴定了O. alta 中的抗性基因类似物(表 S5)。虽然 O. sativa ssp 粳稻 Nipponbare 和籼稻 R498 与 Ct 或 Dt 亚基因组(图 2B)相比,含有更多的核苷酸结合位点(NBS)类型基因,这是由于 NBS-亮氨酸富集重复(NBS -LRR) 基因组中的O. meridionalis 和O. glumaepatula 分裂后的 AA 基因组,O. alta 对于所有四种类型的抗性基因类似物总共包含更多基因,显示出更广泛的潜力抗性谱。此外,Ct 和 Dt 亚基因组和 AA 基因组中转录因子和转录调节因子的数量相似(图 S4A S4C;表 S5)。这些结果表明O.alta 基因组包含大量尚未用于栽培水稻的遗传资源。此外,基于O.alta和其他9个物种之间的蛋白同源性,共鉴定出42,642个基因家族,其中Ct和Dt亚基因组分别为19,925和18,519个(图2C)。在这些家族中,有14125个家族在Ct、Dt和O. sativa中相同,525个家族在Ct基因组具有特异性,363个家族在Dt基因组具有特异性。基于单拷贝基因家族的系统发育分析显示,o.alta Ct亚基因组和o.sativa基因组是最近的邻居,证实了之前的假设,即AA基因组与CC基因组比与DD/EE基因组有更近的共同祖先。AA基因组与CC基因组、CC基因组与DD基因组的估计分化时间分别为457万年前和545万年前(MYA)。
异源四倍体 O.alta 的 Ct 和 Dt 亚基因组均明显大于日本晴和 R498 的亚基因组。分析表明,O. alta 基因组的 61.7% (551.5 Mb) 由重复序列组成(表 1),远高于日本晴的 40.43% 和 R498 的 42.05%。主要区别在于长末端重复序列 (LTR),这是占 O. alta 基因组 24.1%(215.93 Mb) 的主要重复序列,明显高于日本晴的 17.55% 和 R498 的 20.55%(图 2D)。 Gypsy 型 LTR 是最丰富的转座因子亚科,覆盖了 O. alta 基因组的 19.9% (177.60 Mb)(图 2D;表 S2)。然而,估计Gypsy和 Copiatype LTR 的插入突变时间小于一个 MYA(图 2E)。重复序列和Gypsy-type LTRs分别占Dt亚基因组的62.6%和21.6%,高于Ct亚基因组的59.2%和18.7%(图2D)。 PIF-Harbinger转座子富集在编码区上游和下游2kb内(图S2D),表明它们可能在顺式元件的进化中发挥作用。这些结果表明,Gypsy LTRs的扩增是O. alta基因组扩增的主要动力。
2.5 带有CCDD基因组的异源四倍体水稻的遗传多样性
我们对44份野生水稻种质资源进行了重新测序,包括28份CCDD、6份EE和10份CC,共获得922.45 Gb的序列数据(表S1)用于群体基因组分析。每个加入序列的reads与PPR1 V1.0进行比对,CCDD、CC和EE的平均mapping率分别为98.47%、88.20%和57.17%(表S1)。我们发现了3077万个高质量变异,包括21,281,771个SNPs和9,490,896个indel,平均每千碱基有23.8个SNPs和10.6个indel。共有7,373,962个SNPs和3,075,405个indel位于基因区域,包括1,183,604个非同义变体和288,439个移码变体。70779个变体具有潜在的巨大影响,包括54340个SNP和16439个indel,它们会导致引入起始密码子、过早终止密码子和转录本加长。这些数据表明,CCDD种质群体内部、Ct和C、Dt和E基因组之间存在显著差异。
主成分分析(PCA)显示,44个水稻品种明显聚为3组(图3A),即EE品种的第1组,CCDD品种的第2组,CC品种的第3组(图3B)。通过邻域连接树和基于模型的聚类分析,将第2类植物进一步划分为2个聚类(图3C和3D),聚类1中有8个大叶扁桃、2个大叶扁桃和4个大叶扁桃,聚类2中有13个大叶扁桃。CCDD材料的核苷酸多样性(p)估计为0.0049,低于其他多倍体作物如马铃薯(0.0111),但高于二倍体水稻(O. sativa 0.0024和O. rufipogon 0.0030),说明该异源四倍体水稻群体可为今后的功能基因组研究和育种提供丰富的遗传资源。
2.6异源四倍体O. alta的染色体重排
通过将二倍体CC和EEOryza物种的重测序数据与PPR1基因组进行比对,我们能够确定当前的O. alta基因组中哪些部分来自祖先的CC或DD基因组。这显示了两个亚基因组四倍体化后大片段的几次易位(图3E;表S4)。Ct和Dt基因组2号染色体高度共线(同源基因位于同一条染色体上),但从CC和EE基因组到PPR1的比对模式清楚地显示它们之间发生了大量同源交换(图3F)。Hi-C热图上的连续相互作用信号以及这些区域与BioNano地图的一致性表明,这不是由于组装错误导致的(图3G和3H)。
除了同源交换之外,我们发现与EE 基因组读数匹配的 Ct7 上的三个片段与 Ct4 共线,这表明这些片段是从最初的祖先染色体 Dt4 易位的(图 3E 和 S5A)。 Hi-C 热图和 BioNano 数据再次证实了组装的正确性(图 S5B 和 S5C)。同样,我们发现其他几个片段,包括 Dt4 上的一个片段、Dt3 上的一个片段和 Ct1 上的一个片段,分别从祖先染色体 Ct7、Ct6 和 Dt3 易位。此外,我们还鉴定了位于非同源染色体上的 26 个同线块,显然是由 10 个亚基因组内易位、4 个染色体内重复和 12 个染色体间重复引起的(图 3E;表 S4)。 Ct11、Ct12 和 Dt11、Dt12 可能经历了多次重复和易位(图 3E),但其他六条染色体的染色体重排较少。根据每个基因上CC和EE物种的匹配读数,我们进一步鉴定了PPR1基因组中源自祖先CC基因组(祖先CC基因)和祖先DD基因的所有基因,我们发现5672个基因(13.04%)现在在 Ct 亚基因组中的基因是 DD 起源的,而 Dt 亚基因组上的 5,132 个基因(13.54%)是 CC 祖先的。同时,我们发现四倍体化后大量基因丢失;在当前的O. alta 基因组中,5,516 个祖先 CC 基因没有祖先 DD 同源物,3,954 个祖先 DD 基因没有祖先 CC 同源物。所有这些数据表明 O. alta 基因组的高度动态进化。
2.7 利用基因组编辑技术快速驯化PPR1的途径
在亚洲栽培稻的驯化过程中,选择和改良了有利于耕作而非自然生长的性状,如直立生长习性、稻壳颜色、破碎、芒、果皮颜色和粒级,并对其遗传机制进行了研究。广泛研究。野生稻O. alta 具有与现代栽培品种的野生祖先相似的一些特征。为了快速驯化这些性状,我们首先鉴定了二倍体水稻驯化相关基因的O. alta 同源物(图 4A),并发现 10 个重要的驯化相关基因中有 7 个,包括脱粒:qSH1,芒长度: An-1 和An-2,外壳颜色:Bh4,果皮颜色:Rc,圆锥花序形状:OsLG1 和谷物宽度:GW5,的同源物存在于 O. alta 基因组中,具有 >84% (至少 87.5%)的同一性覆盖O. sativa 蛋白质。PROG1是栽培稻直立生长的关键基因,在O. alta的亚基因组中似乎只有低水平的同源物,可能是因为O. alta已经具有直立生长习性。这些驯化相关基因已暴露于各种进化过程。 Sh4 经历了从 Dt 到 Ct 亚基因组的亚基因组间易位,导致其编码区缩短。 GAD1/RAE2 和OsLG1 的同源物都存在于 Ct 亚基因组中,这是由于一个片段从 Dt 亚基因组易位到 Ct 亚基因组。
作为证明这些同源物的修饰可以真正实现野生 O. alta 快速驯化的概念验证,我们使用 CRISPR/Cas9 诱变方法来编辑用于脱粒相关的qSH1 同源物和用于芒长度的An-1同源物。。我们首先设计了一个靶向OaqSH1-CC (OalC01g168290) 和 OaqSH1-DD (OalD01g114050) 的第一个外显子的sgRNA,并鉴定了一个突变体qsh1CR-1,它具有 OaqSH1-CC 的双等位基因移码突变和杂合移码OaqSH1-DD 的突变(图 4B;表 S6)。我们发现野生型PPR1在稻粒和花梗之间有一层完整的脱落细胞,形成类似于野生二倍体稻的纵向连续线,而在qsh1CR-1中,没有脱落细胞线,表明编辑 O. alta 中的 qSH1 同源物可以防止种子破碎(图 4C)。我们进一步设计了一个靶向OaAn-1-CC (OalC04g136090) 和OaAn-1-DD (OalD04g130280) 的第一个外显子的 sgRNA 和另一个靶向OaAn-1-DD 的第一个外显子的 sgRNA,并获得了一个an-1CR-1 和an-1CR-2 在OaAn1-CC 和OaAn1-DD 中具有不同的纯合移码突变(图 4D;表 S6)。我们发现an-1CR-1 (1.61 cm) 和an-1CR-2 (2.63 cm) 的平均芒长均明显短于 PPR1 (4.11 cm) (图 4E 和 4F)。综上所述,这些结果为O. alta的快速驯化提供了坚实的基础。
2.8O.alta 的可变序列与O. sativa农艺上重要的基因同源
除了驯化相关基因外,我们还鉴定了现代二倍体水稻品种中 113 个重要农艺基因的O. alta 同源基因,这些基因决定了水稻产量、谷粒质量、肥力、抽穗期、生物和非生物抗性等重要性状,以及养分利用效率(图 5A;表 S7)。我们发现影响不同特征的基因具有不同的相似度。影响O. sativa 不育性的基因在O. alta 中的保守性很差,因为qHMS7、S5、SaF、Sc-j 和S1TPR 的最佳匹配同源物的相似性小于 40%,并且没有可检测到的 SaM 同源物、WA352 和 pms3(图 5A;表 S7)。与生物胁迫相关的基因的保存也相对较差,这可能是因为亚洲和美洲的病虫害不同。相比之下,除了 COLD1和 CAL1之外,所有与非生物胁迫相关的基因都高度保守,它们分别负责抗寒性和镉积累。幸运的是,我们发现在栽培二倍体和四倍体野生稻之间,与产量、籽粒品质和养分有效利用相关的大部分基因都相当保守。基于这些发现,我们进一步测试了这些现代育种基因的同源物是否可以被改变以改良野生异源四倍体水稻。
绿色革命基因sd1是现代水稻育种中最重要的基因之一,它的突变使水稻茎秆变短,抗倒伏能力提高,收获指数提高。因此,我们针对OaSD1-CC (OalC01g172060)和OaSD1-DD (OalD01g109880)的第一个外显子设计了两个sgRNAs,获得了一个在OaSD1-CC和OaSD1-DD中都含有双等位移码突变的sd1CR-1突变体(图5B;表S6)。我们发现,与野生型PPR1相比,其高度显著降低(图5C)。与通常有4 - 5个伸长节间的O. sativa相比,O. alta有10 - 12个伸长节间。我们对从茎基部开始的前8个节间长度进行了详细的比较,发现在sd1CR-1中,第1和第5节间的长度相对没有变化,而其他6个节间的长度都显著缩短(图5D和5E)。其他5个独立编辑的行也得到了类似的结果(图S6A、S6C和S6D;表S6)。此外,我们还针对二倍体水稻中控制种子形态的关键基因GS3的同源性设计了sgRNA,获得了6个独立突变体,与PPR1相比,它们的籽粒长度显著增加(图5F、5G、S6B、S6E、S6F;表S6)。这些结果表明,在二倍体水稻中获得的知识可以为野生异源四倍体水稻的改良提供有价值的信息。
2.9用碱基替换编辑器和多重编辑技术改进PPR1
Ideal Plant Architecture 1(IPA1)被认为是绿色革命的一个新基因,因为该基因的点突变会扰乱OsmiR156靶向位点来调控其表达水平, 从而导致茎粗增加、抗倒伏性提高、圆锥花序变大、显着提高粮食产量。我们发现OamiR156-DD的序列与OsmiR156相同,与OaIPA1- dd上的目标位点(OalD08g132520)相匹配,而OamiR156-CC的碱基变化单一,与OaIPA1- CC(OalC08g106170)相匹配(图6A和6B)。因此,我们测试了为二倍体水稻优化的碱基编辑器是否能在O. alta中产生功能获得性碱基替代突变,并针对OaIPA1-CC和OaIPA1-DD的miRNA靶点设计了sgRNA。我们获得了一个突变体ipa1CR-1,该突变体在OaIPA1-DD中含有一个点突变,但不影响OaIPA1-CC(图6B;表S6)。对该突变体的详细检测显示,ipa1CR-1的茎直径明显大于PPR1(图6C 6E)。我们进一步研究了OaIPA1-CC和OaIPA1-DD的转录变化,发现在ipa1CR-1的茎基中,OaIPA1-DD的表达量增加了10倍,而OaIPA1-CC的表达量没有变化(图6F)。因此,碱基替换编辑器的使用可以扩展藜麦基因改良的策略。
水稻抽穗期不像其他性状通常是单向变化的,在扩大生境、不同种植制度和不同日长的育种过程中,抽穗期变化更大。在二倍体水稻中,Ghd7弱等位基因的品种可以在温带地区种植用于粮食生产(翁等,2014;薛等人,2008),而在高地理区域,低DTH7活性的品种对增加的日长对提早开花的敏感性较低(Gao等人,2014;Yan et al., 2013)。利用CRISPR/Cas9多重编辑方法,在一个载体中加入3个sgRNA ,分别对OaGhd7-CC (OalC07g145340)、OaGhd7-DD (OalD07g113810)、OaDTH7-CC (OalD04g100060)、OaGhd7-CC (OalC07g145340)、OaGhd7-DD (OalD07g113810)、OaDTH7-CC (OalD04g100060)、OaGhd7-CC (OalC07g145340)、OaGhd7-DD (OalD04g100060)、OaDTH7-CC (OalD04g100060)、OaGhd7-CC (一个CC祖先基因定位于染色体Dt4)和OaDTH7-DD (OalD07g145130),共获得8个T0独立转化的PPR1株系。我们发现这8个株系都含有不同的突变等位基因(图6G;表S6),所有4个基因在6个品系中都被编辑过,这表明这种技术在制造PPR1变异方面非常有效。与它们的基因型一致,这些编辑株系的标题日期变化很大。4个基因均发生突变的品系1在北京移植后抽穗期显著缩短至82天,而野生型PPR1在150天后未能开花。2号线、3号线在1号线开通10天后开通,4 - 8号线在103 - 130天后开通。第1 ~ 7行种子可以充种,第8行种子充种失败,这表明第1 ~ 3行甚至可以在遥远的北方地区播种。更重要的是,我们还开发了一个多重编辑系统,可以以一个单一载体相当高效地针对8或16个基因(图6H和S7;表S6)。综上所述,在不久的将来实现野生异源四倍体水稻的快速驯化和改良成为一种主要粮食作物,在理论和技术上都是合理的。
Discussion:
多倍体化是植物进化过程中最重要的事件之一,可以增加植物的遗传多样性,引入新的遗传组合,促进植物对新环境的适应,并产生积极的效应。大量具有重要经济意义的作物是异倍体;其中包括小麦和燕麦等粮食作物,烟草、棉花和甘蔗等经济作物以及草莓等水果作物,但其中大多数是天然异源多倍体物种。尽管异源多倍体的优势已广为人知,但人工诱导的异源多倍体作物很少,通常是通过长期育种计划筛选出经常遇到的不良特征(例如,小黑麦,一种源自小麦和黑麦杂交的异倍体作物。我们的目标不是在现代作物中诱导异倍体,而是使用基因组编辑从头驯化野生异倍体植物。从选择的野生异源四倍体水稻O. alta基因型PPR1开始,我们建立了高效的组织培养和基因组编辑系统,并产生了高质量的基因组组装。通过利用栽培二倍体水稻中经过充分研究的驯化相关基因,我们在 O. alta 基因组中鉴定了它们的同源物,为编辑其潜在重要的农艺基因提供了必要信息。然后,我们应用 CRISPR/Cas9、碱基编辑和多重编辑技术,通过编辑一系列在二倍体水稻中驯化相关和/或农艺学上重要的基因来改进 PPR1,其中我们获得了具有所需特征的编辑系,包括种子脱粒、芒长度、株高、粒度、茎粗和抽穗日期。目前的工作为实现野生异源四倍体水稻快速从头驯化的技术难题提供了有效的解决方案。我们展示了野生种质的使用、完整的参考基因组、改进的转化方案和多样化的基因组编辑工具,以创造新的作物物种。此后,仍需要巨大的努力和投资才能在农民田间种植新作物品种方面取得最终成功。首先,尽管在野生异源四倍体水稻中已经克服了转化和基因组编辑的障碍,但许多等位基因需要弱效应而不是完全敲除才能产生最理想的性状。为此,仍然迫切需要用于产生各种修饰的高效基因组编辑工具。其次,涉及的基因通常具有多效性,编辑等位基因不同组合的结果难以预测。因此,需要更多的遗传多样性来实现优化工程等位基因的育种计划。第三,与栽培稻相比,野生稻在生物和非生物胁迫抗性等性状方面具有许多优势,这是应对即将到来的气候变化挑战的关键因素。因此,人们对表征野生稻的这些性状和探索分子标记引导下与野生稻杂交的能力有着巨大的兴趣。。不幸的是,由于不仅缺乏基因组信息和转化系统,而且难以构建新的遗传种群和反映这些理想性状的复杂性,野生稻的基因克隆比栽培稻要困难得多。因此,在不完全了解其机制的情况下,将需要经典育种来维持这些性状。第四,由于野生异源四倍体水稻种群具有更高的遗传多样性,它们为未来的功能基因组研究提供了可利用的天然遗传资源,并在新的育种计划中用作杂交。
在过去的几十年里,随着栽培水稻中许多关键基因的克隆,水稻功能基因组学研究取得了重大进展。通过杂交组合来自不同栽培品种的重要等位基因,这极大地有利于水稻育种。水稻的一个成功例子是开发高产优质水稻新品种。目前,已经组装了三个二倍体(AA、BB 和 FF)水稻基因组,但只有 AA 物种具有高质量的假染色体水平基因组。为多倍体基因组生成高质量的基因组组装是一项挑战,尤其是在区分同源亚基因组方面。许多商业上重要的异源多倍体和同源多倍体作物已经被测序和组装,例如小麦、油菜、甘薯、甘蔗 和画眉草contig N50 范围从 480 bp 到 5 Mb。从我们的研究经验来看,优秀的装配体、充足的超长读码测序数据、不同测序策略的组合以及选择杂合度低的好材料是装配多倍体基因组的关键。高质量的O. alta基因组将为四倍体水稻的分子遗传学研究、Oryza物种的进化以及高等植物多倍体化的分子机制提供有力的工具。总之,通过结合(1)多倍体的优势,(2)栽培作物的功能基因组学知识,从头驯化野生异源四倍体水稻 O. alta 的策略为未来创造新型作物提供了明确的途径,(3)野生物种的理想属性,以及(4)通过基因组编辑进行快速基因改造。
写在最后:
看完整篇文章,感觉生物信息学的手段已经是每个生物人无法绕过的一个事情,生物信息学现在越来越像分子克隆,western blot等一样成为每个想学好生命科学的研究生必须学习的一门技术。自己最近趁着疫情开始学习生信中R语言的一些简单应用,希望这是一个好的开始,自己将来做不到数据自己就能分析的水平,也能知道自己的数据到手,去哪里抄点脚本照猫画虎也是好的。