0x01 What

一次读取一行文本，按输入分隔符进行切片，切成多个组成部分，将每片直接保存在内建的变量中，$1,$2,$3....，引用指定的变量，可以显示指定段，或者多个段。如果需要显示全部的，需要使用$0来引用。可以对单个片段进行判断，也可以对所有段进行循环判断。
其默认分隔符为空格

0x02 How

1、命令格式

awk [options] 'program' FILE......

[options]说明

-F: 指明输入时用到的字段分隔符
-v var=VALUE : 自定义变量
在awk中变量的引用不需要加$，而是直接引用

2、使用方法

主要有两种模式
1、awk [options] 'scripts' file1,file2.....
在这种模式中，scripts主要是命令的堆砌，命令之间用分号分割；对输入的文本行进行处理，通过命令print,printf或是输出重定向的方式显示出来，这里经常用到的知识点是：awk的内置变量，以及命令print和printf的使用

2、awk [options] 'PATTERN{action}' file,file2.....
在这种模式中，最重要的是5种模式和5种action的使用，以及awk的数组的使用和内置函数

3 第一种使用模式

1、print

各项目之间使用逗号隔开，而输出时则以空白字符分隔
输出的Item可以为字符串或数值，当前记录的字段（如$1）、变量或awk的表达式，数值会先转换为字符串，而后再输出
print命令后面的Item可以省略，此时其功能相当于print $0,因此，如果想输出空白行，则需要使用print""
如果引用变量$1或其他的，是不能使用引号引起来

2、内置变量

FS : input field seperator,输入的分隔符，默认为空白字符
OFS: output field seperator,输出的分隔符，默认为空白字符
RS : input record seperator,输入的换行符
ORS: output record seperator,输出时的换行符
NF : number of field ,字段个数

awk '{print NF}' /etc/fstab :打印每行的最后一个字段为第几个字段，这里是数量引用，不是对应的值引用
awk '{print $NF}' /etc/fstab : 打印每行中的最后一个字段

NR : number of record,文件中的行数

awk '{print NR}' /etc/fstab: 打印行号，其会个行号都显示
awk 'END{print NR}' /etc/fstab: 显示文本的总行数，其只是在文本处理完成后，只显示一次行号
awk '{print NR}' file1 file2 : 会每把所有文档进行总的编号，而不是单独对文件进行编号

FNR : 对每个文件进行行数单独编号

awk '{print FNR}' file1 file2 : 会对每个文件的行数进行单独的编号显示

FILENAME : awk命令所处理的文件的名称

awk '{print FILENAME}' file1 : 显示当前文件名，但会每行显示一次
awk 'END{print FILENAME}' file1 : 显示当前文件名，但只会显示一次

ARGC : 命令行中参数的个数，其awk命令也算一个参数

awk 'END{print ARGC}' /etc/fstab : 显示共有几个参数

ARGV : 其是一个数组，保存的是命令行所给定的各参数

awk 'END{print ARGV[0]}' /etc/fstab : 显示第一个参数，默认第一个参数个awk命令本身

3、自定义变量

-v var=VALUE : 在options定义
awk 'BEGIN{test="hello";print test}': 在program中定义

4、printf命令

其格式化输出：printf FORMAT,item1,item2....
例子：awk '{printf "%-8s %-8s %-8s %-18s %-22s %-15s\n",$1,$2,$3,$4,$5,$6}' netstat.txt

格式符

%c: 显示字符的ASCII码
%d,%i : 显示十进制整数
%e,%E: 科学计数法数值显示
%f : 显示为浮点数
%g,%G:以科学数法或浮点形式显示数值
%s: 显示字符串
%u: 无符号整数
%%:显示%号自身，相当于转义

修饰符

N : 显示宽度
- : 左对齐（默认为右对齐）
+ : 显示数值符号

输出重定向

4第二种使用模式

awk [option] 'PATTERN{action}' file1,file2....

1、PATTERN的使用

(1)REGEXP：正则表达式，格式为/regular expression/,仅处理能够被此处模式匹配到的行

awk '/^UUID/{print $1}' /etc/fstab
awk '!/^UUID/{print $1}' /etc/fstab

(2)relational expression:表达式，其值非0或为非空字符时满足条件,用运算符
~(匹配)和!~（不匹配）

 awk '$6 ~ /FIN|TIME/ || NR==1 {print NR,$4,$5,$6}' OFS="\t" netstat.txt

(3)Ranges : 指定匹配范围，格式为/pat1/,/pat2/

awk -F: '{NR>=2&&<=10){print $1}' /etc/passwd
awk -F:' /^ root/,/^myuser/{print $1}' /etc/passwd

(4)BEGIN/END模式 : 特殊模式，仅在awk命令执行前运行一次或结束前运行一次

awk -F: 'BEGIN{print "Username    ID    Shell"}{printf "%-10s%-10s%-20s\n",$1,$3,$7}' /etc/passwd ：先打印一个表头
  
awk -F: 'BEGIN{print "username   ID     Shell"}{printf "%-10s%-10s%-20s\n",$1,$3,$7}END{print "end of report."} /etc/passwd ：打印一个表尾

(5)Empty(空模式)：匹配任意输入行

每日一条linux 命令： awk

每日一条linux 命令： awk

0x01 What

0x02 How

1、命令格式

2、使用方法

3 第一种使用模式

1、print

2、内置变量

3、自定义变量

4、printf命令

4第二种使用模式

1、PATTERN的使用

相关阅读更多精彩内容

友情链接更多精彩内容

每日一条linux 命令 ： awk

0x01 What

0x02 How

1、命令格式

2、使用方法

3 第一种使用模式

1、print

2、内置变量

3、自定义变量

4、printf命令

4第二种使用模式

1、PATTERN的使用

相关阅读更多精彩内容

友情链接更多精彩内容

每日一条linux 命令： awk