awk记录-1

a. 准备工作 marks.txt 本文件有4列

1)    Amit     Physics    80
2)    Rahul    Maths      90
3)    Shyam    Biology    87
4)    Kedar    English    85
5)    Hari     History    89

marks2.txt 本文件有部分列有5列

1)    Andy     Physics    80
2)    Jacky    Maths      90    10
3)    Hill    Biology    87
4)    John    English    85 12
5)    Mary     History

b. 样例

  • (1).文本加标题行 "序号 姓名 科目 分数" 显示:
>awk 'BEGIN {printf "序号\t姓名\t科目\t分数\n"} {print}' marks.txt 
序号  姓名  科目  分数
1)    Amit     Physics    80
2)    Rahul    Maths      90
3)    Shyam    Biology    87
4)    Kedar    English    85
5)    Hari     History    89
  • (2).执行awk脚本:将单引号内的脚本写到一个文件,然后通过 -f 引用文件执行:
> cat command.awk 
BEGIN {printf "序号\t姓名\t科目\t分数\n"} {print}

> awk -f command.awk marks.txt
序号  姓名  科目  分数
1)    Amit     Physics    80
2)    Rahul    Maths      90
3)    Shyam    Biology    87
4)    Kedar    English    85
5)    Hari     History    89
  • (3). -v声明一个变量的值,BEGIN前分配
> awk -v user=root 'BEGIN{printf "name=%s\n", user}' `
name=root
  • (4). 计算: + - * / %
> awk 'BEGIN {a=52; b=50; print "a%b=", (a%b)}'  `
a%b= 2
  • (5). BEGIN END 定义变量a,在处理行的过程中增加(可以与行内的内容进行计算),END时输出:(计算总分数)
>awk 'BEGIN { sumScore = 0; printf "总分数sumScore = %d\n", a } {sumScore=sumScore+$NF;print} END{print ">总分数sumScore=",sumScore}' marks.txt`
总分数sumScore = 0
1)    Amit     Physics    80
2)    Rahul    Maths      90
3)    Shyam    Biology    87
4)    Kedar    English    85
5)    Hari     History    89
>总分数sumScore= 431
疲劳的分割线

awk内置变量: NR FNR NF

NR = Number of Records
NF = Number of Fields
FNR = File Number of Records
下面摘自: The GNU Awk User’s Guide

awk divides the input for your program into records and fields. It keeps track of the number of records that have been read so far from the current input file. This value is stored in a predefined variable called FNR, which is reset to zero every time a new file is started. Another predefined variable, NR, records the total number of input records read so far from all data files. It starts at zero, but is never automatically reset to zero.
......
The value of the built-in variable NF is the number of fields in the current record.

翻译与小结
awk将程序的输入分为记录和字段。
它跟踪从当前输入文件到目前为止已经读取的记录数量。

FNR 该值存储在一个名为FNR的预定义变量中,每启动一个新文件时,该变量将重置为零。【每行的行号-单个文件

NR 另一个预定义变量NR记录从所有数据文件中读取的输入记录总数。 它从零开始,但 从不 自动重置为零。【每行的行号-全部文件

NF 内置变量NF的值是当前记录中的字段数。在执行块中$NF可以得到当前行末字段的值

  • (6). 打印全局行号 当前行号 行内列数 行末字段值
> awk 'BEGIN{print "全局行号\t当前行号\t行内列数\t行末字段值"} {print NR,"\t", FNR,"\t", NF,"\t", $NF}' marks.txt marks2.txt

全局行号    当前行号    行内列数    行末字段值
1    1   4   80
2    2   4   90
3    3   4   87
4    4   4   85
5    5   4   89
6    1   4   80
7    2   5   10
8    3   4   87
9    4   5   12
10   5   3   History
疲劳分割线
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1、Nginx日志分析日志格式:'$remote_addr - $remote_user [$time_local...
    运维前线阅读 761评论 0 4
  • Linux指令中文说明传送入口 整理自Linux指令中文说明 文本和数据进行处理的编程语言awk 是一种编程语言,...
    释闲人阅读 2,161评论 1 6
  • awk简介 awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多...
    yeahuh阅读 4,012评论 0 7
  • Linux文本处理工具三剑客: grep:文本过滤器 sed:流编辑器 awk:报告生成器(格式化以后,显示) a...
    溺水的漂流瓶阅读 555评论 1 1
  • 1.会员注册 进入JYS网站http://www.jystzlc.com,点击右上角“注册”,会跳转入注册页面。 ...
    东成西就_49fa阅读 990评论 0 3