phylophlan3使用(更新)

下载、安装

conda create -n phylophlan3
conda activate phylophlan3
conda install -c bioconda phylophlan

软件运行配置文件
无需基因组fna或者faa文件
基因组是fna,配置文件(下一步速度慢,不推荐)

# dna
phylophlan_write_config_file \
-d a \
-o phylophlan.cfg \
--db_aa diamond \
# 使用phylphlan marker蛋白序列库
--map_dna diamond \
# 基因序列map蛋白用diamond
--msa mafft \
--trim trimal \
--tree1 iqtree \
--tree2 raxml \
--verbose > log.cfg

基因组翻译后的faa(速度更快,推荐使用),配置文件。

# protein
phylophlan_write_config_file \
-d a \
-o phylophlan.cfg \
--db_aa diamond \
# 使用phylphlan marker蛋白序列库
--map_aa diamond \
# 蛋白map蛋白用diamond
--msa mafft \ # mafft常用
--trim trimal \
--tree1 iqtree \
--tree2 raxml \
--verbose > log.cfg

参数

-o OUTPUT, --output OUTPUT
-d {n,a}, --db_type {n核酸, a氨基酸}
--db_dna {makeblastdb} DNA索引
--map_dna {blastn,tblastn,diamond} 基因组比对
--db_aa {usearch,diamond} 蛋白索引
--map_aa {usearch,diamond} 蛋白组比对
--msa {muscle,mafft,opal,upp} 对齐
--trim {trimal} 修剪
--tree1 {fasttree,raxml,iqtree,astral,astrid} 构建系统发育
--tree2 {raxml} refine系统发育

使用最大似然法的软件:
FastTree 2-approximately maximumlikelihood trees for large alignments. PLoS ONE
IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Mol. Biol. Evol
RAxML 即是一款能使用多线程或并行化使用最大似然法构建进化树的软件

运行,下载数据库
下载节点运行一个测试文件,获取数据库

source /hwfsxx1/ST_HN/P18Z10200N0423/huty/software/miniconda3_2/etc/profile.d/conda.sh
conda activate phylophlan3

phylophlan \
-i ../lach_test \
-d phylophlan \
# -d 识别数据库,如果没有自动下载
-f phylophlan.cfg \
--diversity medium \
-o out_test \
--nproc 30 \
--fast \
--verbose

参数
-i INPUT, --input INPUT 基因组或蛋白组
-f CONFIG_FILE, --config_file CONFIG_FILE 配置文件
--diversity {low,medium,high} 多样性水平

"low": for genus-/species-/strain-level phylogenies
"medium": for class-/order-level phylogenies
"high": for phylum-/tree-of-life size phylogenies

-o OUTPUT, --output OUTPUT 文件夹名称
--fast 通过减少进化位点,进行快速进化树重建
-d DATABASE, --database DATABASE marker数据库 phylophlan 400 universal marker genes

phylophlan_databases/
├── phylophlan
│   ├── phylophlan.dmnd
│   ├── phylophlan.faa
│   └── phylophlan.faa.bz2
├── phylophlan_databases.txt
├── phylophlan.md5
└── phylophlan.tar

打开分析phylophlan.faa文件,400种蛋白序列,共34万(344503)条,因为数据库都是蛋白序列所以前面建库和比对都用diamond。

   1163 p0000
    855 p0001
...
   1165 p0397
    533 p0398
   1012 p0399

过程

PhyloPhlAn version 3.0.67 (24 August 2022)
Setting "min_num_markers=100" since no value has been specified and the "database=phylophlan"
Loading configuration file "phylophlan.cfg"
Database folder "phylophlan_databases/phylophlan" present
"db_aa" database "phylophlan_databases/phylophlan/phylophlan.dmnd" present
Loading files from "/hwfsxx1/ST_HN/P18Z10200N0423/huty/analysis/Lach/lach_test"
Checking 6 inputs
Cleaning 6 inputs
Mapping "phylophlan" on 6 inputs (key: "map_aa")
Selecting 6 markers from "out_test/tmp/map_aa"
Extracting markers from 6 inputs
Aligning 333 markers (key: "msa")
Trimming gappy regions for 333 markers (key: "trim")
Trimming gappy columns from 333 markers
Trimming not variant from 333 markers
Subsampling 333 markers
...
Concatenating alignments
Alignments concatenated "out_test/lach_test_concatenated.aln" in 0s
Building phylogeny "out_test/lach_test_concatenated.aln"
Phylogeny "lach_test.tre" built in 131s
Resolving 1 polytomies
Resolving polytomies for "out_test/lach_test.tre.treefile"
"out_test/lach_test_resolved.tre" generated in 0s
Refining phylogeny "out_test/lach_test_resolved.tre"
Reducing number of RAxML threads to 20, as it appears to underperform with more threads
Phylogeny "lach_test_refined.tre" refined in 2s

最后一步refine,如果基因组很多会很慢。

结果文件

lach_test_concatenated.aln
lach_test_resolved.tre
lach_test.tre.bionj
lach_test.tre.ckp.gz
lach_test.tre.iqtree
lach_test.tre.log
lach_test.tre.mldist
lach_test.tre.treefile
RAxML_bestTree.lach_test_refined.tre
RAxML_info.lach_test_refined.tre
RAxML_log.lach_test_refined.tre
RAxML_result.lach_test_refined.tre
tmp

参考
PhyloPhlAn 3.0 微生物组系统发育分析
https://github.com/biobakery/biobakery/wiki/PhyloPhlAn-3.0:-Example-02:-Tree-of-life

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容