微信公众号: Eric生信小班
发表期刊:Nature Plant (Feb 10, 2020)
完成单位:中科院植物所、深圳仙湖植物园、福建农林大学、根特大学
苔藓植物(包括角苔、苔和藓三大类)是陆地植物早期分化形成的类群,其形态结构简单,单倍体配子体占主导地位,无真正的根,一般被认为是从水生到陆生的过渡植物类群。角苔是陆地植物七大支系中物种最少的(200-250种),普遍认为角苔是现存陆生植物的根部分枝。此外,角苔也具有一些特异性特征,比如具一个基于蛋白核的碳浓缩机制(CO2-concentrating pyrenoids),这在其它陆地植物中都是没有的,但在绿藻中较常见。
基因组拼装
想要系统认识角苔的特殊进化地位和特异生物学性状,获取全基因组信息当属首要任务。利用Illumina和三代Nanopore测序,拼装获得了119Mb大小的台湾角苔的基因组(contig N50 = 0.8Mb, scaffold N50 = 1.1Mb)(值得注意的是,Illumina和Nanopore测序分别得到了126Gb和64Gb的raw data,经过过滤矫正等质控,最后用于拼接的只剩下17.1Gb和3.8Gb数据,这可能与长库数据有效率、物种特殊、材料污染程度有关)。重复序列占比64.2%,注释到14 629个基因,但BUSCO评估只有89.6%(较低,虽BUSCO评价进化基部物种基因完整性向来不太高,但小立碗藓与地钱也均在92%以上)
Gene-family gain (+)/loss (−) among 19 green plants. The numbers of gained (blue) and lost (red) gene families are shown above the branches. The boxed number indicates the gene-family size at each node. The number of gene families, orphans (single-copy gene families) and number of predicted genes is indicated next to each species
进化分析
系统基因组学分析表明,苔藓植物为单系起源,地钱与小立碗藓,然后与角苔形成姊妹群。基因家族分析表明角苔有2145个基因家族发生丢失,新增497个基因家族。并且,没有发现全基因组倍增事件(没有WGD发生也算是植物基因组的一股清流)。
环境适应性:转录因子
与之前发表在Cell和Adv. Sci.上的两篇藻类基因组文章类似(更多阅读:),转录因子也是重点分析内容。角苔基因组中共鉴定到了333个转录因子,分布在61个TF家族。对于24个作用于植物形态建成或陆地适应的基因家族(含16个TF家族)鉴定发现,与配子体或孢子体发育、单到二倍体转变、分生组织发育、丝状生长、光形态发生和生长素信号转导相关的基因在植物适应陆生环境前就已出现。更多信息详见文章,涉及到很多参与到植物形态发生、陆生环境适应性等基因的描述,这里不得不佩服作者强大的文献功底。
Major innovations in plants and evolutionary features of three bryophyte lineages
环境适应性:基因家族扩张
从基因组水平研究物种环境适应性,基因家族的扩张分析是很重要的一块。于是,在角苔基因组中发现了一类具有PPR结构域基因(三角状五肽重复结构域),与细胞器RNA加工相关。PPR的扩张可能与角苔细胞器中存在大量RNA edit位点相关。通过RNA edit,PPR充当“修复”因子,来减轻因陆生环境中紫外线暴露增加而引起的DNA损伤。(PPR在植物基因组是很常见的一类,其功能过于基础,涉及到RNA加工、DNA修复等,如何能够与适应性挂钩,这就需要强大的文献获取/整合能力,不过好在物种进化方向特殊,涉及到基础功能也说得通,但如果是一般植物,说PPR扩张与适应性相关可能就需要更多证据)。其他与适应性相关的扩张家族还有cupin和P450。
summary of the number of cupin genes from nine species based on a Pfam search of cupin_1 domain (PF00190).
生物学问题:碳浓缩机制
根据已发表的绿藻CCM关键通路基因,作者鉴定了角苔与其它植物中CO2浓缩关键同源基因。比较发现角苔和其它缺少蛋白核的非被子植物中都有CCM核心基因,也就是说CCM可能是一个古老存在的CO2固定通路,但在陆生环境适应过程中,陆生植物发生了CCM核心基因和蛋白核的丢失。
Orthologs were detected based on a BLASTP or TBLASTN search against the genome or transcriptome data of target species using Chlamydomonas reinhardtii sequences as queries (E-value < 1e-7) and further phylogenetic inferences
生物学问题:水平基因转移
水平基因转移(HGT)是最近研究的热点问题之一,小立碗藓和地钱研究均有所报道。在角苔中鉴定到了来自细菌和真菌的水平基因转移事件(19个基因),尤其是参与胁迫响应和代谢通路相关的基因。部分基因家族是三类苔藓植物都发生的HGT,也有部分家族的转移属于特异性HGT,发生HGT较非HGT有更高的GC含量。
Phylogenetic affinities of genes horizontally transferred to A. angustus. a, Phylogenetic tree of glyoxalase (PF13468). b, Phylogenetic tree of NAD-binding dehydrogenase (PF08635).
HGT最简单粗暴的方法——画树
总结:对于早期陆生植物适应性演化研究提供新的见解。