构建一个近乎完整的植物基因组

前言

植物基因组大小跨越几个数量级,倍性和杂合性变化,以及新旧基因组转座子变化等带来组装挑战。三代和物理图谱提供了新机会,单倍型定相、结构变异分析、从头泛基因组研究成为新兴组装热点。

植物基因组发展:

  • 拟南芥:sanger BAC-by-BAC。
  • shotgun OLC (CELERA assembler):木瓜、大豆、杨树等早期测序植物。
  • 454/Illumina DBG 短序列高深度带来植物基因组组装大爆发,但质量较低。
  • 单分子PacBio长度长带来接近完整染色体组装。
  • 辅助技术发展:Hi-C/BioNano(无需昂贵的BAC物理图谱)
  • ONT纳米孔能达上Mb,组装拟南芥、番茄、高粱、香蕉、甘蓝等更连续和完整的版本。

在过去20年种,有400多个植物基因组已发表,包括333个被子植物,15个非被子植物、2个轮藻和44个绿藻。

可查阅:
https://www.plabipd.de/portal/web/guest/sequenced-plant-genomes

1. 单分子长度长测序

PacBio通过CCS产生HiFi 15 kb reads的方法准确率高达99.8%,解决了错误率问题,但每条read成本高了近5倍。

基因组测序的发展,在基因组完整度上已经有了很大提升。


image.png

2. 长度长基因组组装的错误倾向

新算法的设计目的:correct, overlap, and polish long reads with high error-rates。
算法随计算设计、速度、内存使用、复杂基因组利用而变化。

  • 自纠方法self-correction:CANU、Falcon(phase/unzip)、MARVEL、MECAT。利用reads相互比对,需要较高覆盖度。
  • correction-free:基于OLC的minimap2/miniasm、基于DBG的wtdbg2和Flye。要求更高复杂度的基因组。

组装的草图有误差,必须用高覆盖度的长读长或短读长polish,一般大于三次可达到>99.6%的准确性。

  • long reads:Quiver/Arrow (PacBio)、Medaka (ONT)、Nanopolish、Racon。
  • short reads:Pilon

PacBio CCS HiFi软件:Peregrine

3. 物理图谱技术

  • a.Hi-C
  • b.Optical maps


    image.png

4. 解决复杂植物基因组

如下图,两条染色体组装时定相,杂合基因组phasing有如下方法:

  • 右上:嵌合假分子,简化下游分析。
  • 右中:原始reads比对到contigs,解决缺失的单倍型区域,建立一个定相的二倍体组装。
  • 右下:保留部分单倍型,并在基于图的组装中加以标记。


    image.png

5. 利用组装图

组装经典指标是N50,或者最短序列长度大于组装的50%,方法过于简单。
利用组装图可以可视化复杂度和邻接contig的overlap。

  • 纯合简单基因组(左上图):理想的graph对于每个contig(节点)只有一条边和邻接序列相连。
  • 气泡图(左下图):高杂合性,节点(单倍型)被多条边连接。
  • 复杂重复(右上图):在图结构中较模糊,如rRNA,centromeric satellite DNA。
  • 毛团(hairballs,右下图):多拷贝重复,无清晰路径,节点互交。


    image.png

当参考基因组被泛基因组取代时,基因组图论将是代表复杂基因组更好的方法。

挑战和展望

挑战:

  • 多倍体和杂合度

展望:

  • 基因组完整、少gap、定相。
  • denovo替代重测序,挖掘更多多样性,用于群体遗传和泛基因组分析。
  • 基因组注释将落后于组装,提高注释质量需要新技术(如全长cDNA,PacBio Iso-seq等)以及新算法。

参考文献:Todd PMichael. Building near-complete plant genomes. Curr Opin Plant Biol. 2020 Apr;54:26-33.

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容