Shell脚本实战:日志关键字监控+自动告警

来自:今日头条,作者:运维之道中道
链接:https://www.toutiao.com/a6770513931053040131

该程序使用场景说明:主要用于Linux服务器监控程序日志,如出现关键字异常则触发相应的动作或告警操作,通知到邮件联系人。

一、安装邮件服务

1、解压

tar -jxf mailx-12.4.tar.bz2 -C /usr/src/ && cd /usr/src/mailx-12.4/

2、编译

make install UCBINSTALL=/usr/bin/install
image

异常编译报错-1

异常报错解决方法

下载mailx补丁文件“mailx-12.4-openssl_1.0.0_build_fix-1.patch”,将补丁文件和mailx解压缩目录放置同一路径

image

执行打补丁命令:

patch -p0 < mailx-12.4-openssl_1.0.0_build_fix-1.patch
image

进入mailx-12.4重新执行编译命令:

make install UCBINSTALL=/usr/bin/install
image

检测mailx是否安装成功:mailx -V

image

3、配置

vi /etc/nail.rc,在文件的最后添加

set from=

set smtp=

set smtp-auth-user=

set smtp-auth-password=

set smtp-auth=login

如下图所示,修改配置完后保存

image

4、测试发送邮件

echo '邮件正文'|mailx -v -s "邮件标题" 邮箱地址

image

至此邮件功能测试正常,接下来是关键字监控脚本的编写工作,通过日志关键字脚本触发邮件告警脚本实现日志监控

二、关键字监控脚本开发

CheckLogs.sh 日志监控程序

SendMail.sh 发邮件脚本,该脚本可自定义

conf 配置文件目录,chklist为配置文件

image

初次执行CheckLogs.sh脚本会读取日志文件并记录当前读取的行数

image

后续运行脚本则读取更新日志,例如当前日志更新了9行数据,则脚本从最新的9行数据获取关键字

image

测试插入关键字error

image

继续执行脚本可以看到已捕获关键字并触发告警

image

测试多关键字

image

再次执行可以看到已捕获最新更新的日志信息

image

测试频率控制

image

至此相关功能测试已完成。最后附上脚本相关代码如下:

#!/bin/bash
basedir=$(cd `dirname "$0"`;pwd)
logsdir=$basedir/logs
tmpsdir=$basedir/tmps
confdir=$basedir/conf
chkfile=$confdir/chklist
logfile=$logsdir/log.log_$(date +%F)

#创建各种目录
mkdir -p $logsdir $tmpsdir $confdir

#创建配置文件
if test ! -e "$chkfile";then
    echo "#日志文件,关键字(多关键字|隔开),重试次数,最大执行次数,启动命令,停止命令" >$chkfile
fi

#生成日志函数
do_writelog() {
    case $1 in
    i|I)
        shift
        echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|INFO|$@" >>$logfile
        ;;
    e|E)
        shift
        echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|ERROR|$@" >>$logfile
        ;;
    w|W)
        shift
        echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|WARNING|$@" >>$logfile
        ;;
    *)
        echo "$(date +%Y-%m-%d) $(date +%H:%M:%S)|DEBUG|$@" >>$logfile
        esac
}

#日志处理部分代码
cat $chkfile|egrep -v "^($|#)"|while read i;do
(
    app_name=$(echo "$i"|awk -F, '{print $1}')
    if test -z "$app_name";then
        do_writelog e "应用名称为空,退出执行"
        exit 0
    fi
    log_filename=$(echo "$i"|awk -F, '{print $2}')
    if test ! -e "$log_filename";then
        do_writelog e "日志文件($log_filename)不存在,退出执行"
        exit 0
    fi
    log_md5sum=$(echo -n "$log_filename"|md5sum|awk '{print $1}')
    log_gjz=$(echo "$i"|awk -F, '{print $3}')
    if test -z "$log_gjz";then
        do_writelog i "日志文件($log_filename),关键字为空,退出执行"
        exit 0
    fi
    log_retry=$(echo "$i"|awk -F, '{print $4}')
    expr $log_retry + 0 &>/dev/null
    if [ $? -ne 0 ];then
        log_retry=0
    fi
    log_max=$(echo "$i"|awk -F, '{print $5}')
    expr $log_max + 0 &>/dev/null
    if [ $? -ne 0 ];then
        log_max=3
    fi
    start_command=$(echo "$i"|awk -F, '{print $6}')
    stops_command=$(echo "$i"|awk -F, '{print $7}')
    open_sendmail=$(echo "$i"|awk -F, '{print $8}')
    mail_scripts=$(echo "$i"|awk -F, '{print $9}')
    mail_contacts=$(echo "$i"|awk -F, '{print $10}')
    if [ $open_sendmail -eq 1 ];then
        if test -z "$mail_scripts";then
            do_writelog i "应用($app_name),触发动作脚本为空,退出执行"
            exit 0
        fi
        if test -z "$mail_contacts";then
            do_writelog i "应用($app_name),联系人为空,退出执行"
            exit 0
        fi
    fi
    if test ! -e "$tmpsdir/$log_md5sum";then
        log_new_count=$(wc -l $log_filename|awk '{print $1}')
        echo "$log_new_count" >$tmpsdir/$log_md5sum
        do_writelog i "日志文件($log_filename),初始化读取日志行数:$log_new_count,退出执行"
    else
        log_old_count=$(cat $tmpsdir/$log_md5sum)
        expr $log_old_count + 0 &>/dev/null
        if [ $? -ne 0 ];then
            do_writelog e "日志文件($log_filename),读取历史行数失败,退出执行"
            exit 0
        fi
        log_new_count=$(wc -l $log_filename|awk '{print $1}')
        if [ $log_new_count -eq $log_old_count ];then
            do_writelog i "日志文件($log_filename),未更新,退出执行"
            exit 0
        elif [ $log_new_count -lt $log_old_count ];then
            do_writelog i "日志文件($log_filename),跨日更新日志行数:$log_new_count,退出执行"
            echo "$log_new_count" >$tmpsdir/$log_md5sum
        else
           log_upd_count=$(expr $log_new_count - $log_old_count)
           do_writelog i "日志文件($log_filename),历史行数:$log_old_count,最新行数:$log_new_count,更新行数:$log_upd_count" 
           #读取更新的日志
           log_content=$(tail -n +`expr $log_old_count + 1` $log_filename|head -n +$log_upd_count)
           oldIFS=$IFS
           IFS="|"
           count=0
           for i in $log_gjz;do
               if [ $(echo "$log_content"|grep -c -w "$i") -ge 1 ];then
                   let count+=1  
               fi
               if [ $count -gt 0 ];then
                   break
               fi
           done
           IFS=$oldIFS
           if [ $count -gt 0 ];then
               echo "0" >>$tmpsdir/${log_md5sum}.retry
           else
              do_writelog i "日志文件($log_filename),未获取到关键字,退出执行"
              echo "$log_new_count" >$tmpsdir/$log_md5sum
              exit 0
           fi
           if [[ $(wc -l $tmpsdir/${log_md5sum}.retry|awk '{print $1}') -gt $log_retry ]];then
               echo "0" >>$tmpsdir/${log_md5sum}_$(date +%F)
               if [ $(wc -l $tmpsdir/${log_md5sum}_$(date +%F)|awk '{print $1}') -le $log_max ];then
                   $stops_command 1>>$logfile 2>&1
                   $start_command 1>>$logfile 2>&1
                   do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,停止命令:$stops_command,启动命令:$start_command,重启服务"
                   if [ $open_sendmail -eq 1 ];then
                       if test -n "$mail_scripts";then
                           $mail_scripts "应用[$app_name]故障" "日志文件($log_filename),日志内容:$log_content,找到关键字:$i" "$mail_contacts" 1>>$logfile 2>&1
                           if [ $? -ne 0 ];then
                               do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,触发告警失败"
                           fi
                           do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,触发告警通知联系人:[$mail_contacts]"
                       fi
                   else
                       do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,不触发告警"
                   fi
               else
                   do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,重启服务超出当天限制次数:$log_max,退出执行"
               fi
               rm -f $tmpsdir/${log_md5sum}.retry &>/dev/null
           else
               do_writelog i "日志文件($log_filename),日志内容:$log_content,找到关键字:$i,重试检测:$(wc -l $tmpsdir/${log_md5sum}.retry|awk '{print $1}')"
           fi
           echo "$log_new_count" >$tmpsdir/$log_md5sum
           do_writelog i "日志文件($log_filename),更新记次文件完成" 
        fi
    fi
)&
done
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343