maffilter,看名字是一个过滤maf的工具,实际上,他比过滤MAF拥有更多的功能,甚至能构建系统发育树。 文章在2014年发表于BMC genomics (https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3904536/)。
他的底层架构很蠢,还是配置文件形态的架构,不过这也没办法,这个东西最早发布于2010年(和lastz同时代),最后一次更新在2018年,,没有命令行输入流倒也正常。
使用maffilter的初衷是,phast包工具固然全面,但phast对Cactus的比对结果太不友好了。因此,通过使用maffilter作为替代是进行比较基因组学的一个十分不错的选择。为了让这玩意的使用跟上时代,我使用几个脚本将他轻量化了,这部分脚本将会以Comtools的名称发布在GIT上(写完了没抛)。
OK,现在我们讲一下拿到了cactus比对的结果应该怎么进行后续处理;
第一步,过滤150bp片段,保留所有物种都比对上的片段
第二步,提取CDS序列,这时候可以构建串联树
第三步,转VCF进行一部分分析
第四步,构建并联树
可选:转plink格式进行下游分析,转MSMC格式进行群体历史分析
后续更新在git上,写了个基于这个东西的比较基因组学pipeline,可以看(https://github.com/gotouerina/ComTools)