Icelogo Motif 分析

1.获取需要分析的sequence，这里以Kac为例，发生乙酰化修饰的K上下游10个氨基酸。
通过脚本获得序列。

open FA,"$ARGV[0]"; #打开蛋白组的fast文件
$/=">";
<FA>;
while(<FA>){
    chomp;
    my($ID,$seq)=split /\n/,$_,2;
    @id=split /\|/,$ID;
    $id[1]=~s/ *//g;
    #print "$id[1]\n";
    $seq=~s/\n//g;
    #print"$id[1]\n$seq\n";
    $SEQ{$id[1]}=$seq;
    }
    
    
open FA1,"$ARGV[1]"; #打开IDs和Kacs ites文件
open OU,">$ARGV[2]";

$/="\n";

while(<FA1>){
    chomp;
    my($ID,$site)=split /\t/,$_;
    #print"$ID\n";
    if(exists $SEQ{$ID}){
        $seqence= $SEQ{$ID};
        $index=$site-1;

        $leng=length $seqence;
        next, if (($index-1) <9 or ($index+11)> $leng );
        
        $motif_seq1=substr($seqence,$index-10,10);
        $motif_seq2=substr($seqence,$index+1,10);
        $motif=$motif_seq1." ".$motif_seq2;
        print"$ID\t$site\t$motif\n";
        #print OU "$motif\n";

    }
    
}

输入文件格式：

image.png

运行命令：

D:\Portable software\IceLogo\icelogo-1.3.8> perl .\aminoacid_seq_extraction.pl .\uniprot-oryza+sativa.fasta .\oxi_sites.txt oxi_seq.txt

蛋白的Fast squence下载于uniprot网站。

image.png

获得的序列再Icelogo中进行motif预测：

image.png