1.获取需要分析的sequence,这里以Kac为例,发生乙酰化修饰的K上下游10个氨基酸。
通过脚本获得序列。
open FA,"$ARGV[0]"; #打开蛋白组的fast文件
$/=">";
<FA>;
while(<FA>){
chomp;
my($ID,$seq)=split /\n/,$_,2;
@id=split /\|/,$ID;
$id[1]=~s/ *//g;
#print "$id[1]\n";
$seq=~s/\n//g;
#print"$id[1]\n$seq\n";
$SEQ{$id[1]}=$seq;
}
open FA1,"$ARGV[1]"; #打开IDs和Kacs ites文件
open OU,">$ARGV[2]";
$/="\n";
while(<FA1>){
chomp;
my($ID,$site)=split /\t/,$_;
#print"$ID\n";
if(exists $SEQ{$ID}){
$seqence= $SEQ{$ID};
$index=$site-1;
$leng=length $seqence;
next, if (($index-1) <9 or ($index+11)> $leng );
$motif_seq1=substr($seqence,$index-10,10);
$motif_seq2=substr($seqence,$index+1,10);
$motif=$motif_seq1." ".$motif_seq2;
print"$ID\t$site\t$motif\n";
#print OU "$motif\n";
}
}
输入文件格式:
运行命令:
D:\Portable software\IceLogo\icelogo-1.3.8> perl .\aminoacid_seq_extraction.pl .\uniprot-oryza+sativa.fasta .\oxi_sites.txt oxi_seq.txt
蛋白的Fast squence下载于uniprot网站。
-
获得的序列再Icelogo中进行motif预测: