.: 匹配除了换行符以外的任意字符
\d: 匹配一位数字(0,或1,或2,或……)
\w: 匹配字母或数字或下划线或汉字
\s: 匹配任意的空白符
\W: 匹配任意不是字母,数字,下划线,汉字的字符
\S: 匹配任意不是空白符的字符
\D: 匹配任意非数字的字符
\B: 匹配不是单词开头或结束的位置
[\^x]: 匹配除了x以外的任意字符
[\^aeiou]: 匹配除了aeiou这几个字母以外的任意字符
?: 重复零次或一次
{n,}: 重复n次或更多次
*?: 重复任意次,但尽可能少重复
+?: 重复1次或更多次,但尽可能少重复
??: 重复0次或1次,但尽可能少重复
{n,m}?: 重复n到m次,但尽可能少重复
{n,}?: 重复n次以上,但尽可能少重复
\bhi\b: 精确地查找 hi 这个单词
\bhi\b.*\bLucy\b: 先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词。
^\d{5,12}$: 5位到12位数字
\^\w+: 匹配 一行的第一个单词
\(?0\d{2}[) -]?\d{8}: 匹配几种格式的电话号码,像 (010)88886666,或022-22334455,或 0291234567``
捕获
(exp): 匹配exp,并捕获文本到自动命名的组里
(?<name>exp): 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp): 匹配exp,不捕获匹配的文本,也不给此分组分配组号
后向引用用于重复搜索前面某个分组匹配的文本。例如, \1 代表分组1匹配的文本。
例如:\b(\w+)\b\s+\1\b,可以用来匹配重复的单词,像go go, 或者kitty kitty。
可以指定子表达式的组名。要指定一个子表达式的组名,请使用这样的语法 (?<Word>\w+) (或者把尖括号换成'也行: (?'Word'\w+)) ,这样就把 \w+ 的组名指定为 Word了。
零宽断言
(?=exp): 匹配exp前面的位置
(?<=exp): 匹配exp后面的位置
(?!exp): 匹配后面跟的不是exp的位置
(?<!exp): 匹配前面不是exp的位置
\b\w+(?=ing\b) ,匹配以ing结尾的单词的前面部分(除了ing以外的部分),如查找 I'm singing while you're dancing. 时,它会匹配 sing 和 danc。
\b((?!abc)\w)+\b, 匹配不包含连续字符串abc的单词。
(?<![a-z])\d{7}, 匹配前面不是小写字母的七位数字。
注释
(?#comment): 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读