元字符:一个特殊定义的符号
例:
. :代表除了换行符以外的任何字符
\b :代表单词的分界处
\d :代表一个数字
\s :代表空白符,包括空格tab等等
\w :匹配字母或数字或下划线或汉字
^ :匹配字符串的开始
$ :匹配字符串的结束
重复次数:
| 符号 | 代表含义 |
|---|---|
| * | 重复任意次数 |
| ? | 重复0次或1次 |
| + | 重复1次及以上,等价{1,} |
| {x} | 重复x次,其中x为整数 |
| {x,} | 重复x及以上 |
| {x,y} | 重复x到y次 |
例:
\d{3} 连续3个数字
\w{3}\d+ 连续3个字母或数字或下划线或汉字之后接着一个以上的数字
字符匹配
| 符号 | 代表含义 |
|---|---|
| [abc] | a或b或c |
| [a-z] | 小写英文字母 |
| 0-9 | 数字 |
分组匹配
用小括号把正则表达式包起来,再加上重复次数;如([a-z]{1}\d{2}){3}表示一个字母+2个数字的格式重复3次,如a12b34c45
例:
[a-zA-z0-9.]+@([a-zA-z0-9]+.)+[a-zA-z0-9]+ 匹配一个邮箱
https?:[^"]* 匹配网页代码中的http和https链接