"在Linux中正则表达式很重要,在日常使用vim做字处理或程序撰写都会使用到,简单的说,正则表达式就是处理字符串的方法它是以行为单位来进行字符串的处理行为, 正规表示法透过一些特殊符号的辅助,可以让使用者轻易的达到『搜寻/删除/取代』某特定字符串的处理程序!
**grep: **Global search REgularexpression and Print out the line
作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行
模式:由正则表达式字符及文本字符所编写的过滤条件
语法:grep [options] pattern [file...]
默认一般在管理员下grep给予了别名定义:alias grep='grep --color=auto'及当匹配到了以颜色表示出来。
普通用户也自己在~/.bashrc里添加
grep 常见的命令选项:
-v:显示不被pattern匹配到的行
-i:忽略字符大小写
-n:显示匹配到的行号
-c:统计匹配到的的行数
-o:仅显示匹配到的字符串
-q:静默模式,不输出任何信息
-A#:显示匹配到的行及后#行显示出来
-B#:显示匹配到的行及前#行显示出来
-C#:显示匹配到的行及前后各#行显示出来
-e:实现多个选项间的逻辑or关系
-w:匹配整个单词
-E:使用ERE (egrep)
-F:及fgrep,不支持正则表达式。
grep的示例:
1.我们以/etc/passwd文本来匹配我们所需的信息:
grep -v “root” /etc/passwd #除了匹配到的带“root”的行其行行显示出来
[root@centos7 app]#grep -v "root" /etc/passwd
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
.......
tcpdump:x:72:72::/:/sbin/nologin
zj:x:1000:1000:zj:/home/zj:/bin/bash
bob:x:1001:1001::/home/bob:/bin/bash
2.grep -i “root” /etc/passwd #显示匹配到的“root”不分大小写及“root”“ROOT”都可以
[root@centos7 app]#grep -i "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
rooter:x:1002:1002::/home/rooter:/bin/bash
ROOT:x:1004:1005::/home/ROOT:/bin/bash
3.grep -n "root" /etc/passwd #显示匹配到“root”的行及显示行号
[root@centos7 app]#grep -n "root" /etc/passwd
1:root:x:0:0:root:/root:/bin/bash
10:operator:x:11:0:operator:/root:/sbin/nologin
45:rooter:x:1002:1002::/home/rooter:/bin/bash
4.grep -c “root” /etc/passwd #统计匹配到“root”的行数
[root@centos7 app]#grep -c "root" /etc/passwd
3
5.grep -o “root” /etc/passwd #仅显示匹配到的“root”字符串
[root@centos7 app]#grep -o "root" /etc/passwd
root
root
root
root
root
root
6.grep -q “root” /etc/passwd #静默模式,及屏幕上不输出任何信息
[root@centos7 app]#grep -q "root" /etc/passwd
[root@centos7 app]#grep -q "root" /etc/passwd;echo $?
0
及有时候匹配一个字符我只要知道它成功与否。
7.grep -A 1 “root” /etc/passwd #显示匹配到“root”的行及后面的1行
[root@centos7 app]#grep -A1 "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
--
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
--
rooter:x:1002:1002::/home/rooter:/bin/bash
lao:x:1003:1004::/home/lao:/bin/bash
8.grep -B 1 “root” /etc/passwd #显示匹配到“root”的行及前面的1行
[root@centos7 app]#grep -B1 "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
--
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
--
bob:x:1001:1001::/home/bob:/bin/bash
rooter:x:1002:1002::/home/rooter:/bin/bash
9.grep -C 1 “root” /etc/passwd #显示匹配到“root”的行及前后的1行
[root@centos7 app]#grep -C1 "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
--
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
--
bob:x:1001:1001::/home/bob:/bin/bash
rooter:x:1002:1002::/home/rooter:/bin/bash
lao:x:1003:1004::/home/lao:/bin/bash
10.grep -e “root” -e “adm” /etc/passwd #显示匹配到“root”和“bin”的行
[root@centos7 app]#grep -e "root" -e "adm" /etc/passwd
root:x:0:0:root:/root:/bin/bash
adm:x:3:4:adm:/var/adm:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
rooter:x:1002:1002::/home/rooter:/bin/bash
11.grep -w "root" /etc/passwd #显示匹配到的单词“root”
[root@centos7 app]#grep -w "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
grep -E 使用ERE即(egrep)
grep -f 相当于fgrep,不支持正则表达式
REGEXP由一类特殊字符及文本字符所编写的模式,其中有些字符(元字符)不表示字符字面意义,而表示控制或通配的功能
元字符分类:字符匹配、匹配次数、位置锚定、分组
字符匹配:
[] 匹配指定范围内的任意单个字符
[^] 匹配指定范围外的任意单个字符
[:alnum:] 字母和数字
[:alpha:] 代表任何英文大小写字符,亦即A-Z, a-z
[:lower:] 小写字母[:upper:] 大写字母
[:blank:] 空白字符(空格和制表符)
[:space:]水平和垂直的空白字符(比[:blank:]包含的范围广)
[:cntrl:] 不可打印的控制字符(退格、删除、警铃...)
[:digit:] 十进制数字[:xdigit:]十六进制数字
[:graph:] 可打印的非空白字符
[:print:] 可打印字符
[:punct:] 标点符号```
**匹配次数**:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
```* 匹配前面的字符任意次,包括0次
贪婪模式:尽可能长的匹配
.*任意长度的任意字符
\?匹配其前面的字符0或1次
\+匹配其前面的字符至少1次
\{n\}匹配前面的字符n次
\{m,n\}匹配前面的字符至少m次,至多n次
\{,n\}匹配前面的字符至多n次
\{n,\}匹配前面的字符至少n次```
**位置锚定:**
``` ^ 行首锚定,用于模式的最左侧
$ 行尾锚定,用于模式的最右侧
^PATTERN$ 用于模式匹配整行
^$ 空行
^[[:space:]]*$ 空白行
\< 或\b词首锚定,用于单词模式的左侧
\> 或\b词尾锚定;用于单词模式的右侧
\<PATTERN\>匹配整个单词```
**分组:**\(\) 将一个或多个字符捆绑在一起,当作一个整体进行处理,如:\(root\)\+
```分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ...
\1表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
示例:\(string1\+\(string2\)*\)
\1 :string1\+\(string2\)*
\2 :string2```
**后向引用:**引用前面的分组括号中的模式所匹配字符,而非模式本身
**或者:**\|
```示例:a\|b: a或b C\|cat: C或cat \(C\|c\)at:Cat或cat```
##egrep
egrep用法与grep 相差不大
egrep=grep -E
egrep[OPTIONS] PATTERN [FILE...]
扩展正则表达式的元字符:
**字符匹配:**
```. 任意单个字符
[] 指定范围的字符
[^] 不在指定范围的字符```
**次数匹配:**
```*:匹配前面字符任意次
?: 0或1次
+:1次或多次
{m}:匹配m次
{m,n}:至少m,至多n次```
**位置锚定:**
```^ :行首
$ :行尾
\<, \b :语首
\>, \b :语尾```
**分组:**
```()
后向引用:\1, \2, ...```
**或者:**
```a|b: a或b
C|cat: C或cat
(C|c)at:Cat或cat```
![](http://upload-images.jianshu.io/upload_images/6137254-64aa557ef252c52b.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
通过上表我们可以看出egrep的使用比grep简单点,过程没那么繁琐。
例:http://www.jianshu.com/p/a046dfbd0edd