对于awk来说,变量又分为内置变量和自定义变量,输入分隔符FS和输出分割符OFS都属于内置变量。内置变量就是awk预定义好的,内置在awk内部的变量,而自定义变量就是用户定义的变量。
我们先看下awk常用的内置变量。
命令 | 作用 |
---|---|
FS | 输入字段分割符,默认是空白字符 |
OFS | 输出字段分割符,默认是空白字符 |
RS | 输入记录分割符(输入换行符)指定输入时的换行符 |
ORS | 输出记录分割符(输出换行符)输出时用指定符号代替换行符 |
NF | (number of Field)当前行的字段个数(当前行分割了几列),字段数量 |
NR | 行号,当前处理的文本行的行号 |
FNR | 各文件分别计数的行号 |
FILENAME | 当前文件名 |
ARGV | 数组,保存的是命令行所给定的各参数 |
- 内部变量NR
NR比较简单,我们先看NR的例子。
首先,如下图所示,test1文件一共有两行文本,使用空格隔开,第1行有4列,第2行有5列。
而内置变量NR表示每一行的行号,内置变量NF表示每一行中一共有几列。
或者,利用NR内置变量,先打印行号,在打印出整行内容,相当于为test1的没一行都添加了行号一行在输出。
注意:在base中,我们在引用变量时,都会使用$符进行引用,但是在awk中,只有在引用$0,$1等内置变量的值的时候,才会使用$,引用其他变量时,不管是内置变量,还是自定义变量,都不使用$,而是直接使用变量名。
2. 内置变量FNR
内置变量FNR是什么意思?
当我们使用awk同时处理多个文件的时候,并且使用NR显示行号。效果如下图:
从返回结果可以看出,awk处理多个文件的时候,使用NR显示行号,那么,多个文件的所有行会按照顺序进行排序。
可是,如果我们想要分别显示两个文件的行号,该怎么办,这时候就会使用到内置变量FNR,效果如下:
FNR内置变量的作用就是当awk处理多个文件时,分别对每个文件的行数进行计数。
3. 内置变量RS
RS可以理解为Return Separator。输入行分割符,如果不指定,默认的“行分割符”就是我们理解的“回车换行”。
如上图所示,我们先使用默认的“回车换行”作为“行分割符”输出test1文本,这时显示的文本一共2行。
当我们使用“空格”作为“行分割符时”,在awk解析文本时,每当遇到空格,awk就会认为遇到的[空格]是[换行符],于是awk就将文件换行了,而此时人类所理解的[回车换行],对于awk来说并不是所谓的换行符,所以才会出现上图的情况。
所以,正如上图所返回的信息中,我们可以看到,人类所认为的“两行”,共用了一个行号,awk认为他们就是第4行。
4. 内置变量OFS
默认情况下,awk将人类眼中的“回车换行”,当做“输出行分隔符”,此时,awk的世界观和人类的世界观是相同的。
此时,我们改变一下awk的想法,我们让awk认为,“+++”才是真正的输出行分割符,示例如下图所示:
在没有指定输出行分割符之前,awk跟人类的逻辑是一样的,当awk输出文件的时候,如果想要换行,就会“另起一行”(回车换行),可是,若是我们指定了“输出行分割符”为“+++”,那么,当awk在输出文字的时候,如果想要换行,就会“另起一行”(+++)。所有,对于awk来说,他完成了“另起一行”的动作。
输入换行符合输出换行符同时使用。
5. 内置变量FILENAME
FILENAME这个内置变量,从字面意思上看,就是显示文件名。
6. 内置变量ARGC和ARGV
ARGV内置变量表示一个数组,这个数组中保存的是命令行给定的采纳数。【ARG Value表示的是参数值】
上图,我们使用BEGIN模式,输出一个字符串“aaa”,然后,传入两个文件的文件名作为参数,我们发现,BEGIN模式正常执行了打印操作,输出了“aaa”字符串,我们使用同样的命令,同样的BEGIN模式,只不过,这次不只是打印了“aaa”,还打印了ARGV这个数组中第二个元素的值。
ARGV内置变量表示的是一个数组,既然是数组,就需要上图的下标的方式,引用对应元素的值,因为数组的索引都是0开始的,所以,ARGV[1]表示的引用ARGV数组的第二个元素的值,从返回结果可以看到,ARGV[1]对应的是test1。同理,我们又使用了第三条命令,多打印一个ARGV[2]的值,发现ARGV[2]对应的值为test2。即:ARGV内置变量表示的是:所有参数组成的数组。那么ARGV[0]对应的是哪个参数呢?
ARGV的第一个参数居然是:awk参数本身。
好吧,awk就是这么规定的,'pattern{action}'并不被看作是参数,awk被看做为参数。
ARGC可以看做【ARG Count】表示的是参数的数量。也可以理解为ARGV数组的长度。
6. 自定义变量
自定义变量就是用户定义的变量,有两种方法可以自定义变量。
方法一:-v varName=value 变量名区分字符大小写;
方法二: 在program中直接定义;
2.1 方法一自定义变量
这种方法,与设置内置变量的值得方法是一样的。
2.2 program中自定义变量
当然我们也可以一次性定义多个变量。
需要注意的是,第一种方式虽然看起来麻烦,但是这种方法也有自己的优势。
当我们需要在awk中引用shell变量的时候,可以通过方法一间接引用。