[...]位于括号之内的任意字符正则表达式
1、具有特殊含义的字符:
(和):界定期望获取字符串的匹配模式
.(字符点):匹配任何单个字符
+:一次或者多次
?:找到匹配的结果后立刻停止查找
\:转义字符
[]:匹配符合[]内的字符
[0-9]匹配所有数字字符
[a-z]匹配所有小写字母字符
[^0-9]匹配所有非数字字符
[^a-z]匹配所有非小写字母字符
^匹配字符开头的字符
$匹配字符结尾的字符
[\u4e00-\u9fa5]匹配中文[\u4e00-\u9fa5\d]或者[\u4e00-\u9fa5]\d
2、提取所有内容
((?:.|[\r\n])*)
(.*)单行
(.+)单行
(.+?);单行
提取数字:
([0-9]\d*)
([0-9]*)
(\d*)
[...]位于括号之内的任意字符
[^...]不在括号之中的任意字符
.除了换行符之外的任意字符,等价于[^\n]
\w任何单字字符,等价于[a-zA-Z0-9]
\W任何非单字字符,等价于[^a-zA-Z0-9]
\s任何空白符,等价于[\t\n\r\f\v]
\S任何非空白符,等价于[^\t\n\r\f\v]
\d任何数字,等价于[0-9]
\D除了数字之外的任何字符,等价于[^0-9]
[\b]一个退格直接量(特例)
{n,m}匹配前一项至少n次,但是不能超过m次
{n,}匹配前一项n次,或者多次
{n}匹配前一项恰好n次
?匹配前一项0次或者1次,也就是说前一项是可选。等价于{0,1}
+匹配前一项1次或多次,等价于{1,}
*匹配前一项0次或者多次,等价于{0,}
|选择.匹配的要么是该符号左边的子表达式,要么它右边的子表达式
(...)分组.将几个项目分为一个单元.这个单元可由*、+、?和|等符号使用.而且还可以记住和这个组匹配的字符以供此后引用使用
\n和第n个分组所匹配的字符相匹配,分组是括号中的子表达式(可能是嵌套的),分组号是从左到右计数的左括号数
^匹配的是字符的开头,在多行检索中,匹配的是一行的开头
$匹配的是字符的结尾,在多行检索中,匹配的是一行的结尾
\b匹配的是一个词语的边界,简而言之就是位于字符\w和\w之间的位置(注意:[\b]匹配的是退格符)
\B匹配的是非词语的边界的字符