衣被天下、无棉不安—3个现代品种棉花高质量基因组组装和结构变异挖掘

文章信息


发表期刊:Nature Plants

影响因子:15.8/Q1

研究背景

棉花是全球重要的可再生纤维作物,但由于基因型特异性以及品种、管理时间和环境因素之间的复杂相互作用,其产量和纤维品质表现出了高度可变性。由于初始基因库的狭窄,现代育种可能会限制未来棉花产量的增长。依赖准确的品种特异性数据,精确育种和生物技的应用为上述问题提供了潜在的解决方案。因此,作者通过生成三个现代棉花品种(“UGA230”、“UA48”和“CSX8308”)的高质量参考基因组并更新“TM-1”棉花基因组来满足这一需求。分析结果显示在四个基因组中观察到相当大的序列和结构变异,这些变异与“Pima”棉花的基因组渗入、基因调控机制以及表型性状分化有关。这些基因组和比较分析为未来提高全球棉花产量和可持续性的基因研究提供了宝贵的基础。

研究结果

TM-1高质量基因组的组装

目前,TM-1 V2版本的参考基因组被广泛应用于棉花育种和遗传学分析,但其具有一定的局限性,V2组装版本无法准确区分棉花基因组中着丝粒周围大量且高度重复的序列,从而导致组装较为碎片化(包含5,723个contigs)。作者使用116.7× PacBio CLR数据, 55.0× Illumina 数据和172× HI-C数据对TM-1进行了重新组装和注释。由此产生了TM-1 v3 版本高质量参考基因组,该新版本参考基因组只有 91 个contigs(平均每个染色体 2.1 个gap,contig N50 为 40.0 Mb),与 v2版本相比,基因组组装连续性提高了 63 倍(图1a)。

TM-1 基因组具有很高的重复性,重复序列占比70.8%,10.9% 是蛋白质编码转录本,其中34.3%重复序列都是由 Ty3 重复组成的。两个棉花亚基因组(“A”和“D”)表现出高度分化:A亚基因组较大(1,429.26 Mb)和 D亚基因组更紧凑(835.92 Mb)。亚基因组大小近两倍的差异主要是由重复序列导致的,其中 A 亚基因组上重复序列是D亚基因组的2.1 倍(1,076.2 Mb 对 501.6 Mb),Ty3 重复多近三倍(577.0 Mb 对 196.2 Mb),但 Ty1 重复几乎相同(48.7 Mb 对 47.7 Mb)(图 1b)。

图1 TM-1 棉花参考基因组的结构和连续性

3个现代棉花品系的基因组组装

改良品种和现代品种的基因组序列(图 2b、c)和纤维性状(图 2d)与 TM-1 有明显差异。由于棉花基因组较大、重复序列占比高,现代棉花与 TM-1 之间的表型和序列差异足够大,以至于难以确定与作物改良相关的性状目标。因此作者选取了3个具有代表性的棉花品系,作为目标参考基因组,UGA23纤维细腻,产量潜力高,适应生长季节长的地区;UA48成熟早,纤维强度高,长度长;CSX8308轧棉机产量极高,对细菌性枯萎病具有极好的抗性。作者使用与 TM-1 V3 相同的方法对这三个品系的棉花基因组进行组装,得到的基因组具有相似的完整性、准确性和连续性(图 3a、表 1)。作者进一步对四种品系的棉花进行了完整的基因注释,发现了大量基因存在PAV和CNV,此次新发现的基因PAV和CNV为棉花改良提供了新的遗传多样性目标。

图2 TM-1 与三个现代品种之间的分子和表型差异

4个棉花品种比较基因组分析和变异分析

作者对四个棉花品种做了比较基因组分析,这四个基因组具体很好的共线性,没有发生大的易位,只有一些大的倒位,每对基因组之间 98.4% 以上的序列都是完全共线的(图3a、b)。这些大倒位可能与栽培棉花的性状变异有关,如之前发现的与纤维长度相关的QTL与 A08 染色体上的大倒位重叠。基因组家族扩张与收缩结果显示,这些扩张的基因家族与生殖相关的功能有关,UGA230 中与花粉细胞分化有关、UA48 中与微管蛋白复合物组装和生长素运输功能有关,以及 CSX8308 中与表皮细胞分裂、毛状体分化、甲基化和染色质修饰功能有关,这些都会影响纤维细胞数量和纤维长度。

基因存在与缺失变异分析(PAV)分析中,作者发现了 15,472 个同源基因家族不存在与TM-1 中,但存在于一个或多个现代品种基因组中(图3c)。作者将 UA48 基因投射到其他三个基因组上,揭示了非编码序列进化和注释支持是基因PVA的主要驱动力(图3d)。

综上,这些结果证明了开发品种特异性基因组的重要性:如果没有新的基因组,现代种质中发现的 25,326 个(8.32%,平均每个基因组 6,331 个)基因将无法识别。

图3 四种棉花基因组的同源性和 PAV

种间基因渗入影响纤维品质

作者进一步研究了现代棉花品种与皮马棉之间的基因渗入现象,三个现代栽培品种的基因组包含少量(n = 37–51)中等大小(50 kb 至 2.05 Mb)且通常是共享的皮马棉共同祖先区域(图4a),这表明许多基因渗入发生的时间相当近,并且发生在现代品种的共同祖先中。皮马棉纤维质量在所有棉花品系中最高,因此作者证实了基因渗入序列在转录水平上具有功能活性,这表明基因渗入序列保留了部分功能效应。同过对渗入基因的GO分析发现,渗入基因在纤维生产相关的一系列关键生物过程中被富集(图 4b),这表明皮马棉的基因渗入对现代棉花纤维品质改良具有潜在影响。

图4 皮马棉基因渗入现代棉花基因组的位置和转录效应

研究结论

本研究中,作者更新了TM-1参考基因组并组装出3种具有代表性棉花品系的高质量基因组,分析结果显示,四个基因组之间存在相当大的序列和结构变异,这些变异证明与棉花性状息息相关,这表明了开发和利用特定品种基因组的重要性。作者的研究为未来通过精准育种和生物技术手段提升全球棉花产量和可持续性提供了重要的基因基础。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,367评论 6 512
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,959评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,750评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,226评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,252评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,975评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,592评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,497评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,027评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,147评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,274评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,953评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,623评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,143评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,260评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,607评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,271评论 2 358

推荐阅读更多精彩内容