利用awk做nginx的日志分析

nginx的日志用来记录网站的访问记录
nginx日志的存放目录在/var/log/nginx/
nginx的默认日志格式

log_format  main  '$remote_addr - $remote_user [$time_local] "$request" ' ##定义日志格式
                   '$status $body_bytes_sent "$http_referer" '
                   '"$http_user_agent" "$http_x_forwarded_for"'

$remote_addr 显示用户访问源IP地址信息

$remote_user 显示认证的用户信息

[$time_local] 显示访问网站时间

$request 请求保温的请求行信息

$status 用户访问网站状态码信息

$body_bytes_sent 显示响应的数据尺寸信息

$http_referer 记录调用网站资源的链接地址信息(防止用户盗链)

$http_user_agent 记录用户使用什么客户端软件进行访问页面的 (谷歌 火狐 iphone)
$http_x_forwarded_for 当前端有代理服务器时,设置web节点记录客户端地址的配置,此参数生效的前提是代理服务器也要进行相关的x_forwarded_for设置

统计某天的PV量

[root@web02 nginx]# grep -c '10/May/2020' www_access.all 
802

统计某个时间段的PV量

[root@web02 nginx]# awk '$4>="[10/May/2020:10:00:00" && $4<="[10/May/2020:19:00:00 "' www_access.all   | wc -l  ##统计2020年早上10到晚上19的PV量
368

统计2020年5月14日访问次数最多的5个ip(top5)

[root@czq nginx]# awk '/14\/May\/2020/{ips[$1]++} END{for(i in ips){print i,ips[i]}}' access.log | sort -k2rn | head -5  ##k2就是按第2列排序
115.87.98.91 4
139.205.177.98 3
196.42.38.245 2
80.82.70.187 2
101.251.242.238 1

统计2020年5月14日访问次数大于100的ip地址

[root@czq nginx]# awk '/14\/May\/2020/{ips[$1]++} END{for(i in ips){if (ips[i]>100){print i,ips[i] }}}' access.log 

统计2020年5月14日访问前10的url

[root@czq nginx]# awk '/14\/May\/2020/{url[$7]++} END{for(i in url){print i,url[i] }}' access.log  | sort -k2rn | head
/ 26
/operator/basic.shtml?id=1337 3
400 2
/cgi-bin/mainfunction.cgi 2
http://www.baidu.com/cache/global/img/gs.gif 2
7 1
/app/common.js?version=2.4.43&build=1563436823 1
/cloud-app/include/css/uncall.css 1
/ctrlt/DeviceUpgrade_1 1
G?\xC7)J\x08\xB5+^9\x16j" 1

统计每个UR访问内容总大小($body_bytes_sent)

[root@czq nginx]# awk '/14\/May\/2020/{size[$7]+=$10} END{for(i in size){print i,size[i] }}' access.log  
/index.php 555
/ctrlt/DeviceUpgrade_1 157
/cloud-app/include/css/uncall.css 555
/czq.html 322
/recordings/misc/recording_popup.php 555
7 0

统计每个IP访问状态码数量($status)

[root@czq nginx]# awk '/14\/May\/2020/{ip_code[$1" "$9]++} END{for(i in ip_code){print i,ip_code[i]}}' access.log | sort -k1rn | head
208.91.109.50 404 1
202.21.119.162 200 1
196.52.43.57 200 1
196.42.38.245 400 1
196.42.38.245 408 1
194.156.108.13 200 1
185.216.140.17 157 1
185.168.173.151 200 1
179.213.215.231 400 1
177.52.26.50 200 1

统计出现404状态码的ip

[root@czq nginx]# awk '/14\/May\/2020/{if($9=="404"){ip_code[$1" "$9]++}} END{for(i in ip_code){print i,ip_code[i]}}' access.log | sort -k3rn | head
117.141.205.10 404 3
139.205.177.98 404 3
115.87.98.91 404 2
80.82.70.187 404 2
114.35.90.88 404 1
118.24.105.14 404 1
173.242.182.42 404 1
208.91.109.50 404 1

统计前一分钟的pv量

[root@czq nginx]# date=`date -d '1 minute' +%d/%b/%Y:%H:%m` ##格式化前一分钟的date命令并赋值给date
[root@czq nginx]# awk -v a=$date '$0 ~ a {i++} END{print i}' access.log

统计某一时间段的pv量

[root@czq nginx]# awk '$4>="[14/May/2020:08:00:56" && $4<="[14/May/2020:16:07:00"{if($9=="404"){ip_code[$1" "$9]++}} END{for(i in ip_Code){print i,ip_code[i] }}' access.log

统计各种状态码出现数量

[root@czq nginx]# awk '/14\/May\/2020/{code[$9]++} END{for(i in code){print i,code[i]}}' access.log ##单纯打印数量
408 1
"-" 2
157 2
304 3
400 13
403 1
200 18
404 15
SP1 1
[root@czq nginx]# awk '/14\/May\/2020/{code[$9]++;total++} END{for(i in code){printf i"\t";printf code[i]"\t"; printf "%.2f%\n",code[i]/total*100}}' access.log ##打印数量和百分比
408 1   1.79%
"-" 2   3.57%
157 2   3.57%
304 3   5.36%
400 13  23.21%
403 1   1.79%
200 18  32.14%
404 15  26.79%
SP1 1   1.79%
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,711评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,079评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,194评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,089评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,197评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,306评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,338评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,119评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,541评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,846评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,014评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,694评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,322评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,026评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,257评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,863评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,895评论 2 351