linux awk命令介绍以及应用


简介

  awk是一个强大的文本分析、格式化输出工具,相对于grep的查找和sed的编辑,awk在对数据进行分析并生成报告时,显得尤为强大。简单来说,awk就是扫描文件中的每一行,查找与命令行中所给定内容相匹配的模式。如果发现匹配内容,则进行下一个编程步骤,一般是以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。如果找不到匹配内容,则继续处理下一行。
  AWK拥有自己的语言: AWK 程序设计语言,它允许您创建简短的程序,这些程序读取输入文件、为数据排序、处理数据、对输入执行计算以及生成报表,还有无数其他的功能。

常见用法

  • awk [options] 'BEGIN{ action;… } pattern{ action;… } END{
    action;… }' file ...
  • awk [options] 'program' var=value file…

  awk程序通常由: BEGIN语句块、能够使用模式匹配的通用语句块以及END语句块共3部分组成。
  BEGIN初始化代码块:在对每一行进行处理之前,初始化代码,主要是引用全局变量,设置FS分隔符。
  pattern 表示 AWK 在数据中查找的内容,可以使用正则表达式,而 action 是在找到匹配内容时所执行的一系列命令。
  END结尾代码块:在对每一行进行处理之后再执行的代码块,主要是进行最终计算或输出结尾摘要信息。
  {}:命令代码块,包含一条或多条命令。
  program通常是需要放到单引号或双引号中。

特殊要点:

变量或字符 含义
$0 表示整个当前行
$1 每行第一个字段
FS 输入字段分隔符,默认为空白字符
RS 输入记录分隔符,指定输入时的换行符,原换行符仍有效
NF 字段数量变量
NR 每行的记录号
FNR 与NR类似,不过多文件记录不递增,每个文件都从1开始
FILENAME 当前文件名
ARGC 命令行参数的个数
ARGV 数组,保存的是命令行所给定的各参数
~ 匹配,与==相比不是精确比较
!~ 不匹配,不精确比较
== 等于,必须全部相等,精确比较
!= 不等于,精确比较
&& 逻辑与
|| 逻辑或

print和printf

  awk同时提供了print和printf两种打印输出的函数。其中print函数的参数可以是变量、数值或者字符串。字符串必须用双引号引用,参数用逗号分隔。如果没有逗号,参数就串联在一起而无法区分。printf函数,其用法和c语言中printf基本相似,可以格式化字符串,输出复杂时,printf更加好用,代码更易懂。举例如下:

# 加行号打印
awk '{print NR,$0}' /etc/fstab     
# 格式化输出用户名和id
awk -F: '{printf "%-25s%s\n",$1,$3}' /etc/passwd

使用实例

  awk中可以使用匹配代码块、条件表达式(==  !=  >  >= )、逻辑运算符(&& 和 || )、数值运算、IF语句、while语句、数组等等,功能很丰富,下面通过一些实例来介绍一下。

实例1

  fs=":" ; awk -v FS=$fs '{print $1,FS,$3}'  /etc/passwd

  bash中定义的变量,可以传给awk中定义的变量,awk中使用定义的变量的时候,变量前面不需要加上$。

实例2

   awk '{print NR,$0}' /etc/fstab /etc/passwd     显示整体的行号
   awk '{print FNR,$0}' /etc/fstab /etc/passwd   显示各自的行号

实例3

  筛选磁盘分区(以/dev/sd开头标识)利用率 >= 10%的分区,下面是两种实现方式:

  df | awk -F% '$0 ~ "^/dev/sd"{print $1}' | awk '$NF >=10{print $1,$NF}'

  这种方式先是用%进行分割,取第一列,然后又利用了模式匹配,需要用到两次awk。再来看第二种实现方式。

  df | awk '$0 ~ "^/dev/sd"{if($5 ~ /[1-9][0-9]+%/)print $1,$5}'

  该种方式在pattern中用到了正则表达式,里面的action动作中,再一次用到了正则表达式,这样只用到了一次awk。

实例4

  分别计算男性和女性的总分和平均成绩。

[root@centos7 workdir]#cat score.txt
mage  100 male
wang   90 male
zhang 80 female
zhao 68 male
li    100 female
sun  84  female

[root@centos7 workdir]#awk '{total[$3]+=$2;num[$3]++}END{for(gender in total)
{print gender,total[gender],total[gender]/num[gender]}}' score.txt

  这里用到了数组的知识,total是存放男性和女性总成绩的数组,而num是存放男性和女性各自人数的数组。

实例5

[root@centos7 ~]#cat f1.txt
1 2 3 4 5 6 7 8 9 10
10 11 12 13 14 15 16 17 18 19 20
[root@centos7 ~]#awk '{i=1;sum=0;while(i<=NF){sum+=i;i++};print sum,i}' f1.txt         
55 11
66 12

  这里需要注意的是i=1,sum=0,只在第一行的时候执行了一次,也就是变量只赋值了一次。

实例6

  统计/etc/fstab文件中每个文件系统类型出现的次数

  awk '/UUID/{fs[$3]++}END{for (i in fs){print i,fs[i]}}' /etc/fstab

  说明:这里只考虑设备标识是UUID的情况,如果是写设备名,改变一下//里的内容也是可以的。

实例7

  统计/etc/fstab文件中每个单词出现的次数

awk -F '[^[:alpha:]]+' '{for(i=1;i<=NF;i++)if($i ~ /[[:alpha:]]+/)count[$i]++}
END{for(i in count){print i,count[i]}}'  /etc/fstab 

实例8

  提取字符串Yd$C@M05MB%9&Bdh7dq+YVixp3vpw中的所有数字。

echo "Yd$C@M05MB%9&Bdh7dq+YVixp3vpw" | awk -F '[^[:digit:]]+'
 '{for(i=1;i<=NF;i++){if($i ~ /[0-9]+/)print $i}}'
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容

  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 3,210评论 2 25
  • awk介绍awk变量printf命令:实现格式化输出操作符awk patternawk actionawk数组aw...
    哈喽别样阅读 1,564评论 0 4
  • 本章主要学习内容awk介绍 awk基本用法 awk变量 awk格式化 awk操作符 awk条件判断 a...
    楠人帮阅读 1,267评论 0 8
  • awk: grep,sed,awk grep:文本过滤 sed:文本编辑 awk:文本格式化工具; 1 什么是aw...
    木林森阅读 1,778评论 0 16
  • awk:报告生成器,格式化文本输出 内容: awk介绍 awk基本用法 awk变量 awk格式化 awk操作符 a...
    BossHuang阅读 1,456评论 0 9