元字符(正则表达式规定的特殊代码)
1.\b(位置)单词的分界处
\bhi\b
2..(字符)匹配除了换行符以外的任意字符
3.*(数量)指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配
因此,.*连在一起就意味着任意数量的不包含换行的字符。
\bhi\b.*\bLucy\b
意思是:先是一个单词 hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词。
4.\d(数字)匹配一位数字 (0,或1,或2,或……)
0\d\d-\d\d\d\d\d\d\d\d
匹配的字符串:以0开头,然后是两个数字,然后是一个连字符“-”,最后是8个数字。 (也就是中国的电话号码。当然,这个例子只能匹配区号为3位的情形)。
(“-”不是元字符)
简写:
0\d{2}-\d{8}
这里\d后面的{2}({8})的意思是:前面\d必须连续重复匹配2次(8次)。
5.\s(空白符)匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等。
6.\w 匹配字母或数字或下划线或汉字等。
测试正则表达式的工具:
Regex Tester(.Net下的工具)
首先确保已经安装了.Net Framework 2.0,然后下载Regex Tester。这是个绿色软件,下载完 后打开压缩包,直接运行RegexTester.exe就可以了。