1.1 字符组
字符组(character class)是正则表达式最基本的结构之一,要理解正则表达式的“灵活”,理解它是第一步。
1.2 元字符与转义
一些字符在正则表达式中有特殊的含义,比如-
、^
、$
...。但是,有时候并不需要表示这些特殊的意义,只需要表示普通字符,此时就必须做转义处理。
1.3 排除型字符组
排除型字符组(negated character class)非常类似普通字符组,只是在开方括号[
后紧跟一个脱字符^
,写作[^...]
,表示“在当前位置,匹配一个字符组中没有列出的字符”。
1.4 字符组简记法
对于[0-9]、[a-z]等常用字符组,正则表达式提供了更简单的记法,这就是字符组简记法(shorthands)。