统计单拷贝直系同源基因频率

在进行单拷贝直系同源基因构建系统发育树之前,我们会将一些出现频率比较低的单拷贝直系同源基因过滤掉,这就需要先统计频率了,这个脚本使用find函数进行统计。

#!/bin/bash
for i in $(cat $1); do
  find ./*/single_copy_busco_sequences -type f -name "${i}.faa" -exec echo -n . \; | wc -c | awk -v gene="$i" '{print gene, $1}' >> genespe.txt;
done
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容