七. 植物叶绿体基因组--组装,注释和比较作图(GetOrganelle,GeSeq,Chloroplot,IRscope)

一. 简介

  1. 叶绿体是绿色植物,藻类和蓝细菌进行光合作用的场所,光合作用将水和二氧化碳转变为有机化合物并放出氧气。叶绿体所携带遗传物质DNA,以原核细胞的编码方式转录合成一些自身需要的RNA与蛋白质。叶绿体通过分裂方式增殖,通过细胞质遗传传递给后代(也叫母体遗传、单一亲本遗传、非孟德尔遗传等)。内共生起源学说认为叶绿体源于原始真核细胞内共生的蓝藻。
    叶绿体起源(来自百度图片).jpg
  2. 植物叶绿体由LSC, IR, SSC, IR四部分组成,为典型四分体结构,四分体结构翻转构造形成同分异构体,一般组装得到的叶绿体会得到两条序列,主要是SSC顺序的颠倒,可以通过比较选择顺序一致的序列进行后续分析。

参考文献: Palmer, Jeffrey D . Chloroplast DNA exists in two orientations[J]. Nature, 1983, 301(5895):92-93.

微管植物质体基因组特征(版纳所郁文彬老师提供图片).png

二. 组装

GetOrganelle是中国科学院昆明植物研究所金建军郁文彬两位老师共同开发的质体组装软件,论文发表在Genome Biology,其中叶绿体基因组组装方法如下:
首先,通过conda安装GetOrganelle:

[abc@Server GetOrg]$ conda install -c bioconda getorganelle

安装完成后,下载参考序列库:

[abc@Server GetOrg]$ get_organelle_config.py --add embplant_pt,embplant_mt

注意:这里可能会出现报错:Bowtie2 is not available!,可以通过conda重新安装Bowtie2,然后升级到最新版本,如果不成功的话删除conda环境中的Bowtie2相关文件(rm ~/.conda/envs/getorganelle/bin/Bowtie2*),下载安装Bowtie2并添加环境变量中。
然后,运行 GetOrganelle(约2个小时左右):

[abc@Server GetOrg]$ get_organelle_from_reads.py -1 a.fq.gz -2 b.fq.gz -t  10 -o abc_plastome -F embplant_pt -R 10

生成文件中:embplant_pt.K85.complete(scaffolds).graph1.1.path_sequence.fasta和embplant_pt.K85.complete(scaffolds).graph1.2.path_sequence.fasta即为做得到的叶绿体基因组,其中K85表示选择的kmer为85,complete表明组装得到环状基因组,scaffolds或Contigs表示不止一条序列(未拼接成环)。一般GetOrganelle组装会得到两个环,graph1.1和graph1.2,这是因为存在同分异构体,可以通过和模式植物比较选择顺序一致的进行后续分析。

三. 注释

上文得到的叶绿体基因组可以利用在线软件GeSeq进行注释:

GeSeq.jpg

上传序列文件,勾选相关内容,其中输出格式选GenBank格式便于后续作图,然后点提交,运行完后下载GenBank注释文件。
注意:利用GeSeq得到的GenBank文件在后续“五. 边界可视化作图”的时候IRscope软件出现报错,后面试了另一个在线注释软件CPGAVAS,注释得到的GenBank文件IRscope不会报错。
CPGAVAS的具体教程参照:教程 | 使用 CPGAVAS2 进行叶绿体基因组注释

四. 圈图和线图

利用在线软件Chloroplot进行叶绿体基因组作图:

Chloroplot.jpg

可以选择输入Accession Number或上传GenBank 文件,这里我从NCBI下载 Manihot esculenta叶绿体基因组序列进行测试,利用前文GeSeq软件进行注释,得到GenBank 注释文件,和直接输入Accession Number:EU117376.1两种方式进行比较,结果基本一致:
Chloroplot_ Manihot esculenta.png

另外,还有一个在线软件OGDRAW,可以画圈图或线性图,其中线性图更方便将多个图放一起进行比较,输入文件可以利用上文CPGAVAS注释软件输出的gbf文件,输出的线状图如下(线状图通过AI整合):
OGDRAW.png

五. 边界可视化作图

IRscope是一种叶绿体基因组连接位点和边界区域基因可视化工具。

IRscope.jpg

可以输入Accession No.或GeneBank注释文件,以拟南芥(NC_000932)和杨树(NC_009143)作为输入文件,结果如下:
NC_000932 and NC_009143.jpg

注意:在比较分析时可能会出现LSC区域颠倒的情况,可以在组装的时候加上--reverse-lsc参数。

六. 构建进化树

通过上述四和五,同模式植物叶绿体基因组进行比较,确定合适的构型和对应的参数,比如:我在组装叶绿体的时候发现组装的两种构型都和杨树、拟南芥的顺序不一致,有一个比较接近但LSC顺序是颠倒的,这时通过金建军老师的提示,在组装的时候加上参数--reverse-lsc,这样就就得到和模式植物顺序较一致的序列,接下来就可以用叶绿体基因组构建进化树。
首先,将得到的叶绿体基因组合并成一个fasta格式的文件:

[abc@Server]$ ll|grep CRR|awk '{print"cat "$NF"/*complete.graph1.1.path_sequence.fasta >Result/"$NF"_1"}'|sh
[abc@Server]$ ll|grep CRR|awk '{print"cat "$NF"/*complete.graph1.2.path_sequence.fasta >Result/"$NF"_2"}'|sh
[abc@Server]$ cd Result/
[abc@Server]$ ll|grep xiaoxh|awk '{print"sed -i \0471i\\"$NF"\047 "$NF}'|sh
[abc@Server]$ cat * >abc_cp.fas
[abc@Server]$ more abc_cp.fas|grep -v '>'|sed 's/CRR/>CRR/g' >Tree.fas

主要通过awk和sh实现,先将生成的graph1.1和graph1.2 cp到一个文件夹并命名为_1和_2,然后利用sed在每个文件第一行加上新的序列名不带“>”,将所有序列合并,grep -v去掉旧的序列名,利用sed给新的序列名加上 “>”,方法可能过于繁琐。
然后,利用mafft进行多序列比对,利用iqtree建树:

[abc@Server]$ nohup mafft --auto Tree.fas >Tree.fas.mafft 2>Tree.fas.mafft.log&
[abc@Server]$ nohup iqtree -s Tree.fas.mafft -m MFP -bb 1000  -bnni -redo -o NC_010433 &
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,347评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,435评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,509评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,611评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,837评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,987评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,730评论 0 267
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,194评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,525评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,664评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,334评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,944评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,764评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,997评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,389评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,554评论 2 349

推荐阅读更多精彩内容