导读
开始有关病毒的基因组学研究。
分析工具 | 特点 | 发表杂志 | 发表时间 | 被引(2021) |
---|---|---|---|---|
VirSorter | 组装,PERL | PeerJ | 2015 | 585 |
VirSorter2 | 组装 | Microbiome | 2021 | 27 |
vConTACT2 | 组装 python | NBT | 2019 | 173 |
VirFinder | 组装,R k-mer | Microbiome | 2017 | 130 |
GOTTCHA | reads, PERL | Nucleic Acids Res | 2015 | 104 |
ViromeScan | reads, shell集成,真核 | BMC Genomics | 2016 | 65 |
VIP | 组装,shell集成 | Scientific reports | 2016 | 57 |
MARVEL | 组装, python, binning | Frontiers in Genetics | 2018 | 34 |
Prophage Hunter | BGI网页工具 | Nucleic Acids Res | 2019 | 9 |
1. VirSorter
用于prophages (viral genomes integrated in a microbial genome)识别鉴定。可使用有参,无参两种模式鉴定more fragmented and larger scale微生物基因组数据中的病毒信号。可鉴定短于30kb contig中的病毒信号。对长于10kb的contig,virsorter表现最佳。
文章:VirSorter: mining viral signal from microbial genomic data
中文:挖掘微生物基因组数据中的病毒信号
杂志:PeerJ
时间:2015
VirSorter Github: https://github.com/simroux/VirSorter
分析流程:
- 组装:MetaSPAdes
- 抽提病毒序列1:VirSorter (gene enrichment based method)
- 抽提病毒序列2:VirFinder (k-mer frequency based method)
- 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
- 基因预测:MetaProdigal
- crAss-like噬菌体检测
- Tentative病毒contig鉴定
- Pfam结构蛋白鉴定病毒
- 病毒组样品聚类
- 前噬菌体分析
参考:
Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020
VirSorter2
从宏基因/转录组数据中识别病毒信号缺少1. 广谱基因marker 2. 数据库代表 3. 有效工具。但VirSorter2很OK。
标题:VirSorter2: a multi-classifier, expert-guided approach to detect diverse DNA and RNA viruses
中文:一种含多分类器且有专家指导的DNA/RNA病毒检测方法
杂志:Microbiome
时间:2021
VirSorter2 Github: https://github.com/jiarong/VirSorter2
bitbucker: https://bitbucket.org/MAVERICLab/virsorter2/src/master/
2. VirFinder
VirFinder: R package for identifying viral sequences from metagenomic data using sequence signatures。基于病毒序列 k -mers词频和机器学习识别病毒序列的方法。 此方法利用了常用的序列k -mers构建序列相量,构建机器学习分类器,不需要参考病毒序列数据库,显著提高了病毒序列识别的速度和准确性,将有助于在宏基因组学时代下对病毒的研究。
标题:VirFinder: a novel k-mer based tool for identifying viral sequences from assembled metagenomic data
中文:识别宏基因组中病毒序列,基于k-mer
杂志:Microbiome
时间: 2017
单位:南加利福尼亚大学
VirFinder Github: https://github.com/jessieren/VirFinder
分析流程:
- 组装:MetaSPAdes
- 抽提病毒序列1:VirSorter (gene enrichment based method)
- 抽提病毒序列2:VirFinder (k-mer frequency based method)
- 病毒序列分类:NCBI viral RefSeq sequences, NCBI taxonomy data
- 基因预测:MetaProdigal
- crAss-like噬菌体检测
- Tentative病毒contig鉴定
- Pfam结构蛋白鉴定病毒
- 病毒组样品聚类
- 前噬菌体分析
工具比较:
参考:
1 Metagenome Data on Intestinal Phage-Bacteria Associations Aids the Development of Phage Therapy against Pathobionts.
Cell Host & Microbe. 2020
2 VirFinder:基于k-mer的病毒序列预测算法
DeepVirFinder
使用深度学习方法预测病毒序列。该方法对短病毒序列具有较好的预测精度,可用于从宏基因组数据中预测序病毒列。与基于k-mer的VirFinder方法相比,DeepVirFinder通过使用卷积神经网络(CNN)显著提高了预测精度。CNN可以自动从病毒和原核生物序列中学习基因组模式,同时根据学习到的基因组模式建立预测模型。
标题:Identifying viruses from metagenomic data using deep learning
中文:识别宏基因组中的病毒序列,使用深度学习
杂志:quantitative biology
时间:2020
单位:南加利福尼亚大学
DeepVirFinder Github: https://github.com/jessieren/DeepVirFinder
更多:
QB:基于深度学习的病毒序列识别
DeepVirFinder使用指南
安装
# 创建独立环境
conda create -n deepvirfinder
conda activate deepvirfinder
# 安装依赖
conda install python=3.6 numpy theano=1.0.3 keras=2.2.4 scikit-learn Biopython h5py
ProxyError: Conda cannot proceed due to an error in your proxy configuration
# clone 主程序
git clone https://github.com/jessieren/DeepVirFinder
cd DeepVirFinder
chmod 777 dvf.py
./dvf.py --help
python dvf.py --help
3. GOTTCHA
Genomic Origin Through Taxonomic CHAllenge (GOTTCHA)。把细菌和病毒序列分别识别鉴定出来。
文章:Accurate read-based metagenome characterization using a hierarchical suite of unique signatures
GOTTCHA Github: https://github.com/LANL-Bioinformatics/GOTTCHA
4. ViromeScan
文章:ViromeScan: a new tool for metagenomic viral community profiling
Sourceforge: https://sourceforge.net/projects/viromescan/files/?source=navbar
5. VIP
文章:VIP: an integrated pipeline for metagenomics of virus identification and discovery
描述:Virus Identification Pipeline (VIP)
Github: https://github.com/keylabivdc/VIP
6. MARVEL
文章:MARVEL, a Tool for Prediction of Bacteriophage Sequences in Metagenomic Bins
描述:Metagenomic Analysis and Retrieval of Viral Elements
Github: https://github.com/laboratoriobioinformatica/MARVEL
7. Prophage Hunter
文章:Prophage Hunter: an integrative hunting tool for active prophages
BGI网页工具:https://pro-hunter.bgi.com/index.php/Home/Index/index.html
工具比较:
8. vConTACT2
bitbucket: https://bitbucket.org/MAVERICLab/vcontact2/wiki/Home
文章:Taxonomic assignment of uncultivated prokaryotic virus genomes is enabled by gene-sharing networks
中文:通过基因分享网络给META中的病毒基因组做分类注释
杂志:Nature Biotechnology
时间:2019