PGCGAP 是用于原核生物基因组学和比较基因组学分析管道,目前该管道包含 12 个模块,可以接受 Illumina 双端 reads、Oxford reads 或 PacBio reads 作为输入,可以完成基因组组装、基因预测和注释,并可以进行比较基因组学分析,包括构建单拷贝核心蛋白进化树以及单拷贝核心基因 SNPs 进化树,泛基因组分析与进化树构建,全基因组平均核苷酸一致性(ANI)计算,同源蛋白家族聚类及进化树构建,COG 注释,SNPs 和 INDELs calling,抗生素抗性基因 / 毒力因子预测,Multi-FASTA 进化树构建,组装后基因组短序列过滤与统计信息呈现(genome size,GC content……),序列提取,字符串去重复。CGAP更新详情如下或移步官方文档进行查看(https://liaochenlanruo.fun/pgcgap/index-v1.0.35.html#--v1035):
Rewrite the module Pan
, Panaroo is used instead of Roary and the output files have changed, see OUTPUT section for details.
Added function id2seq
to module ACC
for extracting the corresponding sequences from a file to another file according to a number of ids in one file.
Added function getRepeats
to module ACC
for counting the number of repeats of the string for the specified column in a given file.
目前代码已经完成更新,并已经将安装脚本上传至Bioconda。为了体验新功能,请大家通过“pgcgap --check-update”进行更新,最新版本号为v1.0.35(也可以全新安装,见: https://liaochenlanruo.fun/pgcgap/index-v1.0.35.html#installation)。PGCGAP会不定期更新,为了体验最新功能,请大家不定时的检查更新情况。
此外,Linux基础薄弱的老师可以到https://github.com/liaochenlanruo/pgcgap/wiki进行入门学习。
PGCGAP项目地址:https://github.com/liaochenlanruo/pgcgap
如果您觉得PGCGAP对您有帮助的话,可以分享给需要的老师和同学们,请大家多多支持,欢迎引用!
Liu H, Xin B, Zheng J, Zhong H, Yu Y, Peng D, Sun M. Build a bioinformatics analysis platform and apply it to routine analysis of microbial genomics and comparative genomics. Protocol exchange, 2021. DOI: 10.21203/rs.2.21224/v5 .