匹配非数字字符
\D
[^0-9]
[^\d]
匹配单词
\w
与\D 不同的是,\D会匹配空格,标点符号等字符,而 \w不会。在英语环境中,\w 相当于:
[_a-zA-Z0-9]
字符边界和断言
^ 从开始匹配。
$ 从结尾匹配。
\bTHE\b 表示THE 这个单词。
正则表达式的元字符
.^$*+?|(){}[]\-
字符简写式
| 字符简写式 | 描述 |
|---|---|
| \a | 报警符 |
| [\b] | 退格字符 |
| \c x | 控制字符 |
| \d | 数字字符 |
| \D | 非数字字符 |
| \o xxx | 字符的八进制值 |
| \w | 单词字符 |
| \W | 非单词字符 |
| \0 | 空字符 |
| \x xx | 字符的十六进制值 |
| \u xx | 字符的unicode值 |
可以使用 \s 匹配空白字符,它会匹配:
- 空格
- 制表符(\t)
- 换行符(\n)
- 回车符(\r)
\s 有时候也采用大写形式,用来匹配非空字符 \S。
使用元字符的字面值
可以用 \Q 和 \E 之间的字符集来匹配字符串字面值。
比如想匹配$ ,可以使用如下方式:\Q $ \E。