基因家族分析

以MYB为例

  • 从pfam网站下载Myb_DNA-binding.hmm
#使用hmmsearch搜索结构域
hmmsearch --cut_tc --domtblout MYB.out Myb_DNA-binding.hmm species.pep.fasta
grep -v "#" MYB.out|awk '($7 + 0) < 1E-10'|cut -f1 -d  " "|sort -u > > MYB.out_id.txt
#提取研究物种的MYB蛋白序列
seqtk subseq  ../data/10.pep.fasta MYB.out_id.txt >MYB.out_id.fasta
  • 验证提取到的MYB蛋白是否都具有MYB的结构域
    1.可以使用网站 InterPro (ebi.ac.uk)
image.png

但是只能一条一条的进行运行

  1. 本地化批量使用InterPro
    2.1 从InterProScan 5 Help and Documentation - Job Dispatcher Sequence Analysis Tools - EMBL-EBI 下载iprscan5.py文件
    2.2 下载依赖的包
pip install xmltramp2==3.0.10

2.3 运行

source /gss1/env/python3.9.4.env 
python /gss1/home/gaozhh01/biosoft/interProScan/iprscan5.py --multifasta MYB.out_id.20.fasta --maxJobs 25 --useSeqId --email tanwei0817@163.com --outformat tsv

qq邮箱不行,尝试后发现163邮箱可以。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容