awk统计nginx pv uv

awk

awk是一个强大的文本分析工具，相对于grep的查找，sed的编辑，awk在其对数据分析并生成报告时，显得尤为强大。简单来说awk就是把文件逐行的读入，以空格为默认分隔符将每行切片，切开的部分再进行各种分析处理。

awk是处理文本文件的一个应用程序，几乎所有 Linux 系统都自带这个程序。
它依次处理文件的每一行，并读取里面的每一个字段。对于日志、CSV 那样的每行格式相同的文本文件，awk可能是最方便的工具。

awk其实不仅仅是工具软件，还是一种编程语言。不过，本文只介绍它的命令行用法，对于大多数场合，应该足够用了。

基本使用

格式
awk 动作文件名
示例

$awk '{print$ 0}' demo.txt

前面单引号内部有一个大括号，里面就是每一行的处理动作print $0。其中，print是打印命令，$ 0代表当前行，因此上面命令的执行结果，就是把每一行原样打印出来。

awk会根据空格和制表符，将每一行分成若干字段，依次用 $1、$ 2、$3代表第一个字段、第二个字段、第三个字段等等。

$ echo 'this is a test' | awk '{print $3}'
a

修改默认的分隔符

# 按照空格符号进行分割
$ awk -F ':' '{ print $1 }' demo.txt

变量

$NF

变量NF表示当前行有多少个字段，因此 $NF就代表最后一个字段。$ (NF-1)代表倒数第二个字段。

$ awk -F ':' '{print $1, $(NF-1)}' demo.txt
root /root
daemon /usr/sbin
bin /bin
sys /dev
sync /bin
上面代码中，print命令里面的逗号，表示输出的时候，两个部分之间使用空格分隔。

NR

变量NR表示当前处理的是第几行。

$ awk -F ':' '{print NR ") " $1}' demo.txt
1) root
2) daemon
3) bin
4) sys
5) sync
上面代码中，print命令里面，如果原样输出字符，要放在双引号里面。

http://www.ruanyifeng.com/blog/2018/11/awk.html

https://gregable.com/2010/09/why-you-should-know-just-little-awk.html

统计nginx pv uv

查看nginx的配置确定每一列对应的含义

log_format  main '$remote_addr - $remote_user [$time_local] "$request" "$request_body"'
                      '$status $body_bytes_sent '
                      '"$http_referer" "$http_user_agent" "$http_x_forwarded_for" '
                      '"$server_name" $request_time $upstream_response_time';

awk '{print $1}' acces.log | sort | uniq -c | wc -l 

# 分析
只输出第一列的结果
  awk '{print $1}' acces.log  
排序
  sort 
去重  并统计出现次数
  uniq -c
去重之后即是uv
wc -l 

root@app:/etc/nginx# wc /var/log/nginx/access.log
   127627   3471552 102800749 /var/log/nginx/access.log
   #文件的行数为、单词数、字节数

统计pv
直接求行数

awk '{print $1}' access.log|wc -l

求访问最频繁的ip地址

awk '{print $1}' access.log|sort | uniq -c |sort -n -k 1 -r|more

sort -n  : 按照数字排序，否则会按照字符串比较，就会出现2比11大
sort -k 1 ： 指定列数，1是第一列。
sort -r  ： 按照相反的书序排序

求出前10的接口调用

awk '{print $1}' nginx_access.log | sort | uniq -c | sort -n -k 1 -r | head 10 
-n -k 1 -r  :按照数字排序第一列并求倒序

image.png

awk '{if( $5==403) print$ 1}' nginx_access.log | sort | uniq -c | sort -n -k 1 -r | head 10

总结：

-F 指定分割字符 if 可以用来做为判断

awk -F ':'  '{if($5==403) print $1}' nginx_access.log | sort | uniq -c | sort -n -k 1 -r | head 10

最后编辑于：2019.08.26 00:15:33

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,701评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,649评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,037评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,994评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,018评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,796评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,481评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,370评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,868评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,014评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,153评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,832评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,494评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,039评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,156评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,437评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,131评论 2赞 356

awk统计nginx pv uv

awk

基本使用

变量

$NF

NR

统计nginx pv uv

推荐阅读更多精彩内容