收集 | 序列提取工具

1.BED格式相关的提取

bedtools

bedops

2.提取序列相关

seqtik

seqtk

bam2fastq

3.windows提取

TBtools软件

4.perl脚本:get_fa_by_id.pl

用法:

perl get_fa_by_id.pl id pro.fa >id.fa  # id为geneid,pro.fa为库

script:

use strict;
die "perl $0<id><fa>“>输出目录”\n"unless @ARGV==2;
my($id,$fa)=@ARGV;
open IN,$id||die;
my%ha;
map{chomp;$ha{(split)[0]}=1}<IN>;
close IN;
$fa=~/gz$/?(open IN,"gzip -cd $fa|"||die):(open IN,$fa||die);  
$/=">";<IN>;$/="\n";  
my %out;  
while(<IN>){  
    my $info=$1 if(/^(\S+)/);  
    $/=">";  
    my $seq=<IN>;  
    $/="\n";  
    $seq=~s/>|\r|\*//g;  
print ">$info\n$seq" if(exists $ha{$info} && ! exists $out{$info});  
    $out{$info}=1;  
}  
close IN

更多详细用法请查看简书或者帮助文档!!!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。