细胞器基因组(叶绿体、线粒体)组装神器GetOrganelle介绍

GetOrganelle是中国科学院昆明植物研究所金建军郁文彬两位老师共同开发的质体组装软件,论文发表在Genome Biology,十分简单易用,对没有计算机基础的使用者十分友好。

1、安装

软件可以直接使用conda进行安装

conda create -n chloroplast #创建一个虚拟环境
conda install -n chloroplast getorganelle #将getorganelle安装在虚拟环境中
conda activate chloroplast #激活虚拟环境
get_organelle_config.py --add embplant_pt,embplant_mt #下载参考序列

注意:这里可能会出现报错:Bowtie2 is not available!,可以通过conda重新安装Bowtie2,然后升级到最新版本,如果不成功的话删除conda环境中的Bowtie2相关文件(rm ~/.conda/envs/getorganelle/bin/Bowtie2*),下载安装Bowtie2并添加环境变量中。
然后,运行 GetOrganelle.

2、命令介绍

get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -F embplant_pt -o output-plastome -R 10 -t 1 -k 21,45,65,85,105
命令中的参数说明

-1和-2 正向和反向测序原始数据文件 (如果是单向测序, -u)
-F 设定要组装的基因组类型*
-o 结果输出保存的目录(文件夹)名称
-R 提取叶绿体基因 reads 的轮次(轮次越多,耗时越长)
-t 并行使用 CPU 的数量(多核可提速)
-k 调用SPAdes进行 denovo组装的k-mer,数值必须是奇数, 最大值是127

*基因组类型:embplant_pt(高等植物叶绿体), embplant_mt(高等植物线粒体)和 embplant_nr(高等植物核糖体 RNA), animal_mt (动物线粒体), fungus_mt (真菌线粒体)

组装高等植物线粒体基因组的命令

get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.fastq.gz -w 0.6 -F embplant_mt -o output-mitochondria -R  30 -k 21,45,65,85,105

组装高等植物核糖体 DNA的命令

get_organelle_from_reads.py -1 sample_1.fastq.gz -2 sample_2.f
--assembly命令

从现有的装配图中提取质体基因组(.fastg/.gfa;例如长读测序组件):
常用推荐的命令(高等植物叶绿体基因组)

get_organelle_from_assembly.py -g assembly_graph.fastg -F embplan

命令中的参数说明

-g SPAdes组装得到的FASTG的assembly graph
-F 设定要组装的基因组类型
-o 结果输出保存的目录(文件夹)名称

其他参数的命令(高等植物叶绿体基因组)

get_organelle_from_assembly.py -g assembly_graph.fastg -F embplant_pt -o output-plastome --min-depth 10  --max-depth 10000
命令中的参数说明

-g SPAdes组装得到的FASTG的assembly graph
-F 设定要组装的基因组类型
-o 结果输出保存的目录(文件夹)名称
--min-depth 剔除graph中depth低于阈值的contigs

--max-depth 剔除graph中depth高于阈值的contigs
--min-depth 10 ”和“--max-depth10000”这两条命令是备选的,具体的depth需要可以自行设定。

graph.gfa命令

使用Bandage编辑保存是graph.gfa后*

gfa_to_fastg.py graph.gfa

get_organelle_from_assembly.py -g graph.gfa.fastg -F embplant_pt -o output-plastome --no-slim

命令中的参数说明

-g Bandage梳理后转换为fastg的graph*
-F 设定要组装的基因组类群:embplant_pt(叶绿体),embplant_mt(线粒体)和embplant_nr(核糖体 RNA)
-o 结果输出保存的目录(文件夹)名称

*,使用Bandage编辑后,可以“merge all possible nodes”,然后再输出的文件格式gfa图形文件,gfa文件可以用gfa_to_fastg.py做一下转换。虽然gfa也是图形文件,但是图形内容与fastg有差异些复杂图形会输出失败。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343

推荐阅读更多精彩内容