统计网站访问日志Shell脚本

作为一个网站的管理员,web日志有很多信息值得去关注,但每天去查看海量的日志效率很低,于是写了个脚本来统计web日志,结合排程就可以每天定时发送到指定邮箱,方便管理员更直观的了解网站情况。
脚本统计了:
1、总访问量
2、总带宽
3、独立访客量
4、访问IP统计
5、访问url统计
6、来源页面统计
7、404统计
8、搜索引擎蜘蛛统计(谷歌,百度,搜狗)
9、搜索引擎来源统计(谷歌,谷歌HK,百度)

脚本中需要修改的变量:log_path、domain、email

#!/bin/bash
# @Date    : 2017-05-17
# @Author  : yangfannie
# @Name    : aoto_web_log.sh  --Automatic statistics website access log


log_path=/www/logs/yangfannie.com.log
domain="yangfannie.com"
email="admin@yangfannie.com"
maketime=`date +%Y-%m-%d" "%H":"%M`
logdate=`date -d "yesterday" +%Y-%m-%d`
total_visit=`wc -l ${log_path} | awk '{print $1}'`
total_bandwidth=`awk -v total=0 '{total+=$10}END{print total/1024/1024}' ${log_path}`
total_unique=`awk '{ip[$1]++}END{print asort(ip)}' ${log_path}`
ip_pv=`awk '{ip[$1]++}END{for (k in ip){print ip[k],k}}' ${log_path} | sort -rn | head -20`
url_num=`awk '{url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
referer=`awk -v domain=$domain '$11 !~ /http:\/\/[^/]*'"$domain"'/{url[$11]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
notfound=`awk '$9 == 404 {url[$7]++}END{for (k in url){print url[k],k}}' ${log_path} | sort -rn | head -20`
spider=`awk -F'"' '$6 ~ /Baiduspider/ {spider["baiduspider"]++} $6 ~ /Googlebot/ {spider["googlebot"]++} $6 ~ /Sogou web spider/ {spider["sogouspider"]++}END{for (k in spider){print k,spider[k]}}'  ${log_path}`
search=`awk -F'"' '$4 ~ /https:\/\/www\.baidu\.com/ {search["baidu_search"]++} $4 ~ /https:\/\/www\.google\.com\.hk/ {search["googlehk_search"]++} $4 ~ /https:\/\/www\.google\.com/ {search["google_search"]++}END{for (k in search){print k,search[k]}}' ${log_path}`
echo -e "概况\n报告生成时间:${maketime}\n总访问量:${total_visit}\n总带宽:${total_bandwidth}M\n独立访客:${total_unique}\n\n访问IP统计\n${ip_pv}\n\n访问url统计\n${url_num}\n\n来源页面统计\n${referer}\n\n404统计\n${notfound}\n\n蜘蛛统计\n${spider}\n\n搜索引擎来源统计\n${search}" | mail -s "$domain $logdate log statistics" ${email}

博客地址:http://yangfannie.com

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 中国互联网用户群已经成为世界最大的互联网群体。与此同时,中国互联网网站的发展也历经了几个阶段,从单纯的网络媒体到现...
    零一间阅读 9,940评论 1 41
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,995评论 25 709
  • 声明:本地图炮由来自河南、安徽等地域歧视大省的编辑制作,不服也别打他们。 北京市 天津市 河北省 山东省 东北三省...
    网易王三三阅读 6,876评论 17 42
  • “今天,你所能给孩子最危险的建议就是:去学校,好好念书,然后找个安全的工作。” 书里提出三个概念 1.不为金钱工作...
    听风看树望天空阅读 3,738评论 2 9
  • 卖点、噱头 卖点分为一级卖点、二级卖点 一级卖点往往只有一个,是最重要的 二级卖点可能有2-4个,相对重要 噱头属...
    易卿阅读 3,034评论 0 1

友情链接更多精彩内容