问题: 查看log中所有被调用的方法接口,抽取出方法名?
第一种方式
echo "456methodqwe789lmn"| grep -Po '(?<=method)\D+(?=\d)'
结果:qwe
-P, --perl-regexp PATTERN is a Perl regular expression
-o, --only-matching show only the part of a line matching
第二种方式
echo "xxx=a yyy=234b zzz=c" | awk '{match($0,"yyy=([0-9]+)",a)}END{print a[1]}'
结果:234
/tmp/log.xx 内容如下:
fiiiiiiidddbarrrr
foooooooddddbarrr
awk '{ if(match($0, /(fo+)(.+)(bar*)/, arr)){ print arr[1], arr[2], arr[3]} }' /tmp/log.xx
输出:fooooooo dddd barrr
第三种方式
只限查nginx日志
cat 50850210.log | awk -F 'method=' '{print $2}' | awk -F '&' '{print $1}'
综上所述 第二种方式抽取能力最强
解决这个问题的博文:
http://www.php-oa.com/2008/12/20/power-perl.html
摘录所需要的内容:
(?<=pattern) 后向查找声明,只有在 pattern 已经匹配下面的表达式,并且不将 pattern 的结果放入$& 变量中,才匹配下面的语句
如/(?<=\t)\W+/匹配制表符是否恰好在\W+前出现,但又不将制表符送到 $& 中;
(?=pattern) 前向查找声明,如果正则表达式在下一次匹配 pattern 时,就开始匹配,而且不影响匹配效果.如 /\w+(?=\t)/ 将匹配制表符是否恰好在 \w+ 后面出现,并且制表符不添加到 $& 的值中;
(?!pattern) 如果正则表达式在后面不匹配 pattern ,才会开始匹配.如/foo(?!bar)/,只有当出现 foo,并且后面不出现 bar 时才开始匹配;
perl处理完后会给匹配到的值存在三个特殊变量名
$&, $, $'.匹配上的那部分字符串将自动存储在 $& 之中.变量 $1 中的值为 $' 中的内容,而 $& 为整个被匹配的部分,匹配部分的前一部分存放在 $
之中,后一部分被存到 $'.另一种说法是, $` 中含有正则表达式引擎在匹配 成功前所找到的变量,而 $' 为此模式还没有匹配的剩余部分.如果将这三个变量放在一起,你将得到原始字符串
扩展博文:
http://www.cnblogs.com/chengmo/archive/2010/10/10/1847287.html
http://www.linuxsong.org/2010/09/awk-string-function/