Linux的awk命令

awk将一行内容称为一条记录,将用指定分隔符分隔的列称为域;
awk一般以空格作为域分隔符,以\n作为记录分隔符;
awk也可以使用BEGIN和END进行匹配;

0、执行awk程序的3种方式

(1)、命令行方式
语法形式:awk ' awk程序语句' 被处理文件名
(2)、执行awk脚本方式
语法形式:awk -f awk脚本文件名 被处理文件名
(3)、执行shell脚本文件,不过指定编辑器为awk
语法形式:先vi编辑shell脚本文件,文件名后缀为.sh,不过在开头需要指定#!/bin/awk,这点和shell脚本不同,shell脚本开头指定的是#!/bin/bash。然后在终端输入:./shell脚本文件 被处理文件.

1、awk内置变量

ARGC               命令行参数个数
ARGV               命令行参数排列
ENVIRON            支持队列中系统环境变量的使用
FILENAME           awk浏览的文件名
FNR                浏览文件的记录数
FS                 设置输入域分隔符,等价于命令行 -F选项
NF                 浏览记录的域的个数
NR                 已读的记录数
OFS                输出域分隔符
ORS                输出记录分隔符
RS                 控制记录分隔符

2、BEGIN模块和END模块

BEGIN模块后紧跟着动作块,这个动作块在awk处理任何输入文件之前执行。所以它可以在没有任何输入的情况下进行测试。它通常用来改变内建变量的值,如OFS,RS和FS等,以及打印标题。如:awk 'BEGIN{FS=":"; OFS="\t"; ORS="\n\n"}{print $1,$2,$3} test。上式表示,在处理输入文件以前,域分隔符(FS)被设为冒号,输出文件分隔符(OFS)被设置为制表符,输出记录分隔符(ORS)被设置为两个换行符。awk 'BEGIN{print "TITLE TEST"}只打印标题。

END不匹配任何的输入文件,但是执行动作块中的所有动作,它在整个输入文件处理完成后被执行。如awk 'END{print "The number of records is" NR}' test,上式将打印所有被处理的记录数。

3、变量应用实例

对/etc/passwd,输出:文件名 行号 每行列数 每列内容
awk -F ':''{print "filename:" FILENAME ", linenumber:" NR", columns:" NF ", linecontent:" $0}' /etc/passwd

使用printf,代码更简洁、易读
awk -F ':''{printf("filename:%5s, linenumber:%s, columns:%s, linecontent:%s\n"), FILENAE, NR, NF, $0}' /etc/passwd
其中$0表示所有域

4、参考文献:

0、awk 用法(使用入门)(推荐)
1、awk,sed,grep,cut,uniq,sort,tr,wc,head,tail的常见用法
2、 正则表达式及grep、sed、awk、cut、sort、uniq工具
3、执行awk程序的3种方式

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转载 原文的排版和内容都更加友好,并且详细,我只是在这里贴出了一部分留作自己以后参考和学习,如希望更详细了解AWK...
    XKirk阅读 3,276评论 2 25
  • awk介绍awk变量printf命令:实现格式化输出操作符awk patternawk actionawk数组aw...
    哈喽别样阅读 1,599评论 0 4
  • 简介:awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤...
    请叫我毒舌小公举阅读 572评论 0 1
  • awk:报告生成器,格式化文本输出 内容: awk介绍 awk基本用法 awk变量 awk格式化 awk操作符 a...
    BossHuang阅读 1,469评论 0 9
  • linux资料总章2.1 1.0写的不好抱歉 但是2.0已经改了很多 但是错误还是无法避免 以后资料会慢慢更新 大...
    数据革命阅读 12,239评论 2 33