正则化表达式与通配符
"."符号
点符号用于匹配除换行符之外的任意一个字符。例如,r.t可以匹配rot,rut,但是不能匹配root。
例:grep 'r..t' /etc/passwd
"*"符号
"*"符号用于匹配前一个字符0次或者任意多次,比如ab*,可以匹配a、b、abb等。"*"号经常和"."号一起使用,比如”.*”代表任意长度的不包含换行的字符。
例如:”r.*t”代表查找包含字母r,后面紧跟任意长度的字符,再跟一个字母t的行。
“\{n,m\}”符号
虽然”*”可用于重复匹配前一个字符,但却不能精确的控制匹配的重复次数,使用“\{n,m\}”符号则能达到要求。
“\{n\}”符号匹配前面的字符n次,“\{n,\}”匹配前面的字符至少n次以上(含n次)。
“\{n,m\}”匹配前面的字符n到m次。
“^”符号
这个符号用于匹配开头字符的行
例如:grep ‘^root’ /etc/passwd
“$”符号
用于匹配结尾字符的行
例如:grep ‘^r.*h$’ /etc/passwd
符号“^$”则代表改行为空
“[]”符号
用于匹配方括号内出现的任一字符。用符号“-”作限定
例如:[A-Za-z]匹配所有的字母,[^A-D]代表取反即除了字母A-D以外的字母,例如:“^1[38][0-9]\{9\}”代表手机号码
“\”符号
为转义符。比如[ \- ]此时”\-”代表“-”,再如想打入一个点,则\.*代表匹配任意长度的点号。
“\<”符号和“\>”
这两个符号分别用于界定单词的左边界和右边界。
比如“\”则用于匹配以”hello”结尾的单词。
“\<\>”则用于精确匹配任意一个字符串。
例如:grep “\”
\n为换行符,\r为一个回车符,\t为一个制表符,\f为一个换页符,\s为任何空白字符,\S为任何非空白字符。
扩展的正则表达式
在使用这些扩展符号前需要使用命令egrep。
“?”符号
“?”符号用于匹配前一个字符0次或1次,所以”ro?t”仅能匹配rot或者rt.
“+”符号
“+”符号用于匹配前一个字符1次以上,所以”ro+t”就可以匹配rot、root.
“|”符号
“|”符号是”或”的意思,即多种可能的罗列
例如:^0[0-9]\{2\}-[0-9]\{8\} | ^0[0-9]\{3\}-[0-9]\{8\}
“|”符号
“()”符号通常和”|”符号连用,用于枚举一系列可替换的字符。
例如021-88888888和0511 88888888可以使用代码:^0[0-9]\{2,3\}(-| )[0-9]\{8\}
再如:h(ar|oo|ol)d可以匹配hard, hold或hood
特殊的POSIX字符,示例如下:
grep支持一类特殊的POSIX字符:
[:alnum:]文字数字字符
[:alpha:]文字字符
[:digit:]数字字符
[:graph:]非空字符(非空格、控制字符)
[:lower:]小写字符
[:cntrl:]控制字符
[:print:]非空字符(包括空格)
[:punct:]标点符号
[:space:]所有空白字符(新行,空格,制表符)
[:upper:]大写字符
[:xdigit:]十六进制数字(0-9,a-f,A-F)
例如:搜索以数字开头的行:grep ^[[:digit:]] zzbds.txt
通配符
“*”符号
“*”符号代表0个或多个字符。比如*.doc代表所有以.doc结尾的文件。A*.doc代表以字母A开头的doc文件。
“?”符号
“?”符号代表的是任意的一个字符,例如A?.doc代表的是以字母A开头,文件名第二个字母为任意字母的doc文件。
“{}”符号
可以匹配所有括号内包含的以逗号隔开的字符。
例如:ls –l {A,B,C}.doc和命令ls –l [A-C].doc列出所有以字母A,B,C开头.doc结尾的文件
嵌套功能:ls –l {[A-Z]*.doc,[0-9]??.txt}
“^”符号和“!”符号
这两个符号往往和”[]”一起使用,当出现在”[]”中的时候,代表取反。