正则表达式是一个描述字符模式的对象。
定义
JavaScript 中的正则表达式用RegExp对象表示,可以通过 RegExp()构造函数定义,也可以直接通过引号包裹字符的方式来定义,例如:
var pattern = /s$/
用来匹配所有以字母s 结尾的字符串。
与下面定义等价。
var pattern = new RegExp("s$")
字符类定义
字符 | 匹配 |
---|---|
[...] | 方括号内任意字符 |
[^...] | 不在括号内的任意字符 |
. | 除换行符和其他Unicode行终止符之外任意字符 |
\w | 任意ASCII字符组成的单词 等价于 [a-zA-Z0-9] |
\W | 任意不是ASCII字符组成单词,等级与[^a-zA-Z0-9] |
\s | 任何Unicode空白符 |
\S | 任何非Unicode 空白字符的字符。 |
\d | 任何数字 等价于 [0-9] |
\D | 除数字外 任意字符 等价于 [^0-9] |
[\b] | 退格直接量(特例) |
注意:方括号内 可以放特殊的转义,如/[\s\d]/ 匹配 任意空白符或者数字。
表示退格符 /[\b]/
重复
字符 | 含义 |
---|---|
{n,m} | 匹配前一项至少至少 n次 不能超过m次 |
{n,} | n次或者更多 |
{n} | n次 |
? | 0次或者1次 等价{0,1} |
+ | 一次或者多次, 等价于{1,} |
* | 0次或者多次,等价于{0,} |
例子:
/\d{1,2}/ 匹配1-2个数字
/\s+java\s+/ 匹配前后带一个或多个空格的字符串 java
注意: * 和 ? 可以匹配0个字符。 例如 /a*/ 与字符串 'bbb'是匹配的
选择、分组
正则表达式可以包括指定选择项、子表达式和引用前一子表达式的特殊字符。'|'用于分隔。例如 /ab|cd/ 可以匹配字符串 ab 或者cd。
/\d{3}|[a-z]{4}/ 匹配三位数字或者四个小写字母。 | 类似||或操作。
圆括号有多种作用。
1.把单独的项目组合成子表达式,以便可以像处理一个独立的单元那样用| * + 等来对单元内的项进行处理。 例如/java(script)?/可以匹配 字符串java 后面的script可有可无。/(ab|cd)+|ef/可以匹配'ef'也可以匹配 ab 或者 cd 一次或多次。个人感觉作用 类似 运算符() 设置作用域。
- 另一个作用是在完整的模式中定义子模式,当一个正则表示式成功和目标字符串匹配时,可以从目标串中抽取出和圆括号中的子模式相匹配的部分。假如检索在一个或多个小写字母后面跟随一位活多个数字,可以用/[a-z]+\d+/ 可以写成(/[a-z]+\d+/ ) 就可以检索到匹配中抽取数字。
指定匹配位置
字符 | 含义 |
---|---|
^ | 匹配字符串的开头,在多行检索中,匹配一行的开头 |
$ | 匹配字符串的结尾,在多行检索中,匹配一样的结尾 |
常用
字符 | 含义 |
---|---|
^ | 匹配字符串的开头,在多行检索中,匹配一行的开头 |
$ | 匹配字符串的结尾,在多行检索中,匹配一样的结尾 |
RegExp对象
用法:
第二个参数可以 g i m
g 只影响于 exec、match 方法。
若不指定 g,则:每次调用 exec 都只返回第一个匹配;match 也是只返回第一个匹配。
若指定 g,则:每次调用 exec 都从上一个匹配之后查找新的匹配;match 则是返回所有的匹配。
参数 i 是指忽略大小写,注意仅是忽略大小写,并不忽略全半角。
m 影响对行首、行尾的解释,也就是影响 ^、$。
若不指定 m,则:^ 只在字符串的最开头,$ 只在字符串的最结尾。
若指定 m,则:^ 在字符串每一行的开头,$ 在字符串第一行的结尾。
全局匹配字符串中的5个数字。
var pattern = new RegExp("\\d{5}","g")
RegExp 对象有 3 个方法:test()、exec() 以及 compile()
test()方法检索字符串中的指定值。返回值是true或false。
exec()方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回null
compile()方法用于改变RegExp。
compile()既可以改变检索模式,也可以添加或删除第二个参数。