流程:QIIME和Mothur
在扩增子数据分析中,分析点相对成熟,软件繁多,盘点下来不止百种。一一安装又浪费资源又浪费时间,打包了多种软件的流程式软件备受青睐。这其中最为有名的便是QIIME和Mothur, 基本上可能用到的分析点大多都打包进去了。拼接:flash
目前最为主流的拼接软件仍为flash,但如果扩增片段过长或过短时,flash拼接效果可能不尽如人意,针对这些情况用pear或pandaseq拼接可能会有惊喜序列比对:Muscle和Mafft
几款序列比对软件都打包在了QIIME中,调用即可得到。几款软件中,Pynast和Infernal类似,都是基于参考库比对,但Infernal运行速度要慢得多,应用也少很多。Muscle和Mafft都是不依赖于参考库的全局比对软件。嵌合体的去除:usearch。VSEARCH
主要是de novo和基于参考库两种方法,结合了两种方法的usearch61被打包在qiime中(identify_chimeric_seqs.py),是目前主流的方法之一。但是注意,上面说到过,usearch的64位版本是收费的!前几年专门用uchime去嵌合体也应用较多,但现在官网上已指出不推荐单独安装uchime,推荐直接下载usearch。VSEARCH是作为替代usearch的开源软件推出的,与usearch运算速度不分上下,是mothur中嵌合体去除和聚类的推荐方法,建议大家可以试试。OTUs聚类:uparse、uclust、mothur
的方法有非常多,主要分为启发式算法和层次聚类算法两种,前者有uparse、uclust、CD-HIT等,后者如mothur和oclust等。从应用情况来看,目前主流上的聚类软件还是以uparse、uclust、mothur几种为主。物种注释:PICRUSt需要与Greengene配合使用,Tax4fun推荐与Silva配合使用
扩增子分析中,16S序列注释以Greegene、Silva和 RDP为主,早期Greegene用的最多,当然这与打包在QIIME中密不可分,2013年5月后就一直没有更新,做分析的童鞋纷纷转去用Silva注释,Silva基本上每年还是都有更新的,好玩的是,后面我们会讲到两个比较有名的功能预测软件,PICRUSt需要与Greengene配合使用,Tax4fun推荐与Silva配合使用。另外,真菌ITS注释主要还是应用Unite数据库。功能基因早期用NT库注释效果惨不忍睹,
近几年Fungene不断完善,基本上是功能基因扩增子测序物种注释的不二选择了。功能预测:
由于扩增子本身是对物种层面的分析,如能实现对其功能的预测,能解决的科学问题就多了。目前来说,功能预测软件仍以PICRUSt应用最多,但随着大家对古菌、真菌等多种非细菌群体的关注和注释数据库的更迭,其他软件应用也变多了。比如,上面我们说到,随着注释数据库的变更,Tax4Fun应用增多;专注于于环境样本的生物地球化学循环过程的FAPROTAX,真菌功能预测的FUNGuild等。常用作图及统计软件
1、基础作图类
R ggplot2:
https://cran.rproject.org/web/packages/ggplot2/
Perl SVG: https://metacpan.org/pod/SVG
Python matplotlib: https://matplotlib.org/
QIIME: http://qiime.org/
2、物种统计及可视化
STAMP: kiwi.cs.dal.ca/Software/STAMP
LefSE:
http://huttenhower.sph.harvard.edu/galaxy/
Metastat: http://clovr.org/docs/metastats/
QIIME: http://qiime.org/
3、多样性分析
QIIME:http://qiime.org/
Mothur: https://www.mothur.org/
Usearch: http://drive5.com/usearch/
4、系统发生树可视化
GraPhlAn:http://huttenhower.org/galaxy/
iTOL: https://itol.embl.de/
5、环境因子分析
R vegan:
https://cran.r-project.org/web/packages/vegan/
Canoco5: http://www.canoco5.com/
6、网络互作分析
Cytoscape: http://www.cytoscape.org/
Gephi:https://gephi.org/
🚗 🚗 老司机点评:这部分给大家列了一些常见的软件,一般来说,如果得到了物种注释后的otu_table和序列比对后构建的发生树rep_phylo.tre,基础的分析部分就已经做完了,后续分析主要是基于物种统计及展示、组间比较(多样性--alpha_div,群落结构--beta_div等)、关联分析(网络互作、环境因子等),根据需求可能还会有功能预测分析等,结合其他验证类实验解释微生物多样性变化相关联的科学问题。
摘抄:
9个模块+40余款软件+老司机辣评 | 16S信息分析流程软件和数据库合集
原创: Sonia
微信公众号:生信者言 2017-09-14 08:00:00