生物信息学中可能用到的几个awk操作命令

awk作为强大的文本分析工具其功能十分强大。

其语法结构为 :awk “{pattern + action}” {filename}

for example:

1.输出任意一列数据

awk "{print $n}" filename

其中n表示域,分割域的默认符是空格或者Tab

2.可过滤数据,比如输出第n域大于80和第m域小于20的数据

awk “{if($n>80&&$m<20) print$0}" filename

3.利用正则表达式数据输出符合要求的数据,即匹配输出

awk “$0 requirement{print $0}" filename 

4.输出固定行

awk ” requirement“ filename

5.合并文件

awk ”BEGIN{while((getline<"filename1")>0)1[$1]=$0}$1 in 1{print $0"\t"1[$1]}" filename2

6.fastq转换fasta

awk “{getline seq ; getline plus ; getline qual ; sub("@".">",$) ; print $0 "\n"seq}" filename

补充一个sed命令:

sed -n "xxx" filename(输出第几行)

sed -n ”xxx-yyy" filename(输出第xxx-yyy行)

就简单介绍这几个,其他的在使用的时候可以再自行搜索。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 3,296评论 2 25
  • awk: grep,sed,awk grep:文本过滤 sed:文本编辑 awk:文本格式化工具; 1 什么是aw...
    木林森阅读 1,840评论 0 16
  • sed与awk实例 文本间隔 在每一行后面增加一空行 将原来的所有空行删除并在每一行后面增加一空行。这样在输出的文...
    stuha阅读 1,936评论 0 21
  • 一. AWK 说明 awk的处理文本和数据的方式:它逐行扫描文件,从第一行到最后一行,寻找匹配的特定模式的行,并...
    西华子阅读 962评论 0 4
  • 1、Nginx日志分析日志格式:'$remote_addr - $remote_user [$time_local...
    运维前线阅读 778评论 0 4