画进化树的时候,总会碰到菌株太多然后进化树完全看不清。前不久发现github上有一个脚本可以做到根据Mash的距离来聚类菌株,从而达到减少分析菌株量的目的。于是使用了一下,感觉效果良好。
脚本不用安装,前提是装好了Mash。
python dereplicator.py 输入文件夹/ 输出文件夹/ --threshold 0.005
最重要的参数还是--threshold,默认是0.005,是决定两株菌株核酸平均一致性多少才会聚类起来,数值越小,最后的菌株就越多。
参考
https://github.com/rrwick/https://github.com/rrwick/Assembly-Dereplicator