Gblocks它可以消除DNA或蛋白质序列中排列不一致的位置和不同的区域。这些位置可能不是同源的,或者可能已经被多个取代所饱和,在进行系统发育分析之前消除比较方便。Gblocks选择块的方式与通常手工操作的方式类似,但遵循可重复的一组条件。对于缺少大段连续的非保守位置、间隙位置缺乏或密度低、侧翼位置保守程度高的情况,选择的块体必须满足一定的要求,使最终的对齐更适合于系统发育分析。Gblocks输出几个文件以可视化所选的块。Gblocks等程序的使用减少了手工编辑多个比对的必要性,使自动化大数据集的系统发育分析成为可能,最后,便利了比对的复制和其他研究人员后续的系统发育分析。
linux使用:
Gblocks proteins.fasta -t=p # 使用蛋白质序列 ,
# protenins.fasta 指需要处理的fasta format,也可以是NBRF/PIR format
更多参数如下:
-t=p/d/c # 序列类型p/d/c分别对应蛋白质、DNA、密码子
-b1= #保守位置的最小序列数(50%的序列数+ 1),应该大于序列数的一半,小于或等于序列总数的任意整数
-b2= #最小数量的序列为侧翼位置,(序列数的85%)等于或大于保守位置序列的最小数目的任意整数
详情见 :http://molevol.cmima.csic.es/castresana/Gblocks/Gblocks_documentation.html