misa和primer3结合快速设计SSR引物

文件下载

下载misa,同时将misa.ini放在misa的同一个文件夹下,然后下载三个perl脚本get_set_trimmer.plp3_in.plp3_out.pl,建议下载到同一个文件夹下。

介绍

misa.ini :配置文件
p3_in.pl:输入 misa.pl 的输出结果(file.fasta.misa),将引物设计的参数文件(模板,产物长度,目标区域等)导入到一个以“p3in”为后缀的文件中。
get_est_trimmer.pl:针对EST序列,可以除去EST序列中短的序列和两端不明确的碱基。
p3_out.pl:对primer3产生的文件进行提取合,得到最后的结果文件 filename.result。

  • 这里以玉米1号染色体的序列为例进行演示,玉米基因组的fa文件可以在ensembl网站上下载
perl misa.pl  Zea_mays.AGPv4.dna.chromosome.1.fa

生成的文件说明

Zea_mays.AGPv4.dna.chromosome.1.fa.misa:以表格的形式列出微卫星的类型和位点;
Zea_mays.AGPv4.dna.chromosome.1.fa.statistics:统计微卫星的类型和频数。

因为如果直接使用p3_in.pl进行转换生成的文件会比较大,所以下面多了几步#提取misa文件中的染色体编号和开始,结束的位置,两边各延伸150bp,生成一个bed文件。

cat Zea_mays.AGPv4.dna.chromosome.1.fa.misa |awk 'NR>1 {print $1"\t"$6-150"\t"$7+150}' >Zea_mays.AGPv4.dna.chromosome.1_ssr.bed
#使用bedtools工具提取重复序列
bedtools getfasta -fi Zea_mays.AGPv4.dna.chromosome.1.fa -bed Zea_mays.AGPv4.dna.chromosome.1_ssr.bed -fo Zea_mays.AGPv4.dna.chromosome.1_ssr.fa

再进行一次misa查找一次

perl misa.pl Zea_mays.AGPv4.dna.chromosome.1_ssr.fa

Zea_mays.AGPv4.dna.chromosome.1.fa.misa

Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.misa

比较一下这两次的结果可以知道我们做了什么,需要提醒的是可以有多种方法达到这样的结果

  • 接下来就是修改p3_in.pl文件,这样使用它生成的文件就可以直接在primer3上面运行了,修改的内容可以参考primer3文件下的example文件,将p3_in.pl文件的输出内容和example的内容一致,我现在使用的版本的修改内容是:
print OUT "PRIMER_SEQUENCE_ID=$id"."_$ssr_nr\nSEQUENCE=$seq\n";

改为

print OUT "SEQUENCE_ID=$id"."_$ssr_nr\nSEQUENCE_TEMPLATE=$seq\n";

调用p3_in.pl

perl p3_in.pl Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.misa 
#然后使用primer3进行设计引物
~/software/primer3-2.4.0/src/primer3_core --default_version=1 -- output=Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.p3out Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.p3in
  • 使用p3_out.pl对设计好的引物进行处理,生成自然阅读的格式,但是需要对这个脚本进行处理,修改的方式和上面修改的方式类似,就是按照primer3生成的文件来修改#首先就是将输出的编号进行修改,因为用primer3生成的引物是从0开始的,而且可能有多对引物,所以得增加输出的列,将下列文件
print OUT "ID\tSSR nr.\tSSR type\tSSR\tsize\tstart\tend\t";
print OUT "FORWARD PRIMER1 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER1 (5'-3')\tTm(癈)\tsize\tPRODUCT1 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER2 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER2 (5'-3')\tTm(癈)\tsize\tPRODUCT2 size (bp)\tstart (bp)\tend (bp)\t"; 
print OUT "FORWARD PRIMER3 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER3 (5'-3')\tTm(癈)\tsize\tPRODUCT3 size (bp)\tstart (bp)\tend (bp)\n";

改为

print OUT "ID\tSSR nr.\tSSR type\tSSR\tsize\tstart\tend\t";
print OUT "FORWARD PRIMER0 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER0 (5'-3')\tTm(癈)\tsize\tPRODUCT0 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER1 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER1 (5'-3')\tTm(癈)\tsize\tPRODUCT1 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER2 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER2 (5'-3')\tTm(癈)\tsize\tPRODUCT2 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER3 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER3 (5'-3')\tTm(癈)\tsize\tPRODUCT3 size (bp)\tstart (bp)\tend (bp)\t";
print OUT "FORWARD PRIMER4 (5'-3')\tTm(癈)\tsize\tREVERSE PRIMER4 (5'-3')\tTm(癈)\tsize\tPRODUCT4 size (bp)\tstart (bp)\tend (bp)\t";
  • 然后就是,将提取内容的代码进行修改,就是将前面几行中没有0的地方加上0,再在后面加上几次重复
/PRIMER_LEFT_SEQUENCE=(.*)/ || do {$count_failed++;print OUT "$misa\n"; next};  my $info = "$1\t";    
/PRIMER_LEFT_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT=\d+,(\d+)/; $info .= "$1\t";   
/PRIMER_RIGHT_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT=(\d+),\d+/; $info .= "$1\t"; 
/PRIMER_RIGHT=(\d+),\d+/; $info .= "$1\t";      
/PRIMER_LEFT_1_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1=\d+,(\d+)/; $info .= "$1\t";      
/PRIMER_RIGHT_1_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_1_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_1=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE_1=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_1=(\d+),\d+/; $info .= "$1\t";      
/PRIMER_LEFT_2_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2=\d+,(\d+)/; $info .= "$1\t";      
/PRIMER_RIGHT_2_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_2_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_2=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE_2=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_2=(\d+),\d+/; $info .= "$1";

改为

/PRIMER_LEFT_0_SEQUENCE=(.*)/ || do {$count_failed++;print OUT "$misa\n"; next};  my $info = "$1\t";    
/PRIMER_LEFT_0_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_0=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_RIGHT_0_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_0_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_0=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE_0=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_0=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_0=(\d+),\d+/; $info .= "$1\t";      
/PRIMER_LEFT_1_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1=\d+,(\d+)/; $info .= "$1\t";      
/PRIMER_RIGHT_1_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_1_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_1=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE_1=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_1=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_1=(\d+),\d+/; $info .= "$1\t";      
/PRIMER_LEFT_2_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2=\d+,(\d+)/; $info .= "$1\t";      
/PRIMER_RIGHT_2_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_2_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_2=\d+,(\d+)/; $info .= "$1\t";    
/PRIMER_PRODUCT_SIZE_2=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_2=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_2=(\d+),\d+/; $info .= "$1";    
/PRIMER_LEFT_3_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_3_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_3=\d+,(\d+)/; $info .= "$1\t";  
/PRIMER_RIGHT_3_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_3_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_3=\d+,(\d+)/; $info .= "$1\t";  
/PRIMER_PRODUCT_SIZE_3=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_3=(\d+),\d+/; $info .= "$1\t";  
/PRIMER_RIGHT_3=(\d+),\d+/; $info .= "$1";  
/PRIMER_LEFT_4_SEQUENCE=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_4_TM=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_4=\d+,(\d+)/; $info .= "$1\t";  
/PRIMER_RIGHT_4_SEQUENCE=(.*)/;  $info .= "$1\t";  
/PRIMER_RIGHT_4_TM=(.*)/; $info .= "$1\t";  
/PRIMER_RIGHT_4=\d+,(\d+)/; $info .= "$1\t";  
/PRIMER_PRODUCT_SIZE_4=(.*)/; $info .= "$1\t";  
/PRIMER_LEFT_4=(\d+),\d+/; $info .= "$1\t";`  
/PRIMER_RIGHT_4=(\d+),\d+/; $info .= "$1";
  • 最后运行p3_out.pl脚本即可
perl p3_out.pl Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.p3out Zea_mays.AGPv4.dna.chromosome.1_ssr.fa.misa
最后的结果
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容