Icelogo Motif 分析

1.获取需要分析的sequence,这里以Kac为例,发生乙酰化修饰的K上下游10个氨基酸。
通过脚本获得序列。

open FA,"$ARGV[0]"; #打开蛋白组的fast文件
$/=">";
<FA>;
while(<FA>){
    chomp;
    my($ID,$seq)=split /\n/,$_,2;
    @id=split /\|/,$ID;
    $id[1]=~s/ *//g;
    #print "$id[1]\n";
    $seq=~s/\n//g;
    #print"$id[1]\n$seq\n";
    $SEQ{$id[1]}=$seq;
    }
    
    
open FA1,"$ARGV[1]"; #打开IDs和Kacs ites文件
open OU,">$ARGV[2]";

$/="\n";

while(<FA1>){
    chomp;
    my($ID,$site)=split /\t/,$_;
    #print"$ID\n";
    if(exists $SEQ{$ID}){
        $seqence= $SEQ{$ID};
        $index=$site-1;

        $leng=length $seqence;
        next, if (($index-1) <9 or ($index+11)> $leng );
        
        $motif_seq1=substr($seqence,$index-10,10);
        $motif_seq2=substr($seqence,$index+1,10);
        $motif=$motif_seq1." ".$motif_seq2;
        print"$ID\t$site\t$motif\n";
        #print OU "$motif\n";

    }
    
}

输入文件格式:


image.png
image.png

运行命令:

D:\Portable software\IceLogo\icelogo-1.3.8> perl .\aminoacid_seq_extraction.pl .\uniprot-oryza+sativa.fasta .\oxi_sites.txt oxi_seq.txt

蛋白的Fast squence下载于uniprot网站。


image.png
  1. 获得的序列再Icelogo中进行motif预测:


    image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。