参考:https://www.omicsclass.com/question/705
- 首次用hmmsearch对我的蛋白质进行结构域搜索,最终只得到30个结构域。
hmmsearch --cut_tc --domtblout output.txt TPC.hmm protein.faa
- 拿这30个结构域多序列比对,获得ALN格式文件
这里我使用的是clustalw在线工具clustalw - hmmbuild自建hmm文件
hmmbuild new2.hmm domain.aln
- 用新获得的自建hmm文件new2.hmm再次搜索
注意此时需要去掉参数--cut_tc,否则会获得报错:Error: TC bit thresholds unavailable on model domain
hmmsearch --domtblout output2.txt new2.hmm protein.faa
- 结果:用结果自建的hmm文件搜索可获得更多的结构域!
- 还没搞清楚--cut_tc是什么意思
这里附上官方教程的解释
以及官网教程的传送门pdf