Regular Expression使用单个字符串来描述、匹配一系列符合某个句法规则的字符串
1-1 工具
-
Javascript正则可视化工具 https://regexper.com
-
Sublime-Text 正则匹配功能
2-1 RegExp对象
JavaScript通过内置对象RegExp支持正则表达式
实例化RegExp对象
- 字面量
var reg = /\bis\b/g;
// \b : word boundary 单词边界
- 构造函数
var reg = new RegExp('\\bis\\b', 'g');
修饰符
- g:global 全文搜索,不添加,搜索到第一个匹配停止
- i:ignore case 忽略大小写,默认大小写敏感
- m:multiple lines 多行搜索
2-1 元字符
元字符在正则表达式中有特殊含义的非字母字符
2-2 字符类
字符类
- 我们可以使用元字符[]来构建一个简单的类
- 所谓类是指某些特性的对象,一个泛指,而不是特指某个字符
- 表达式[abc]把字符a、b、c归为一类,表达式可以匹配这类的字符
'a1b2c3d4'.replace(/[abc]/g, 'x');
x1x2x3d4
字符类取反
- 使用元字符^创建 反向类/负向类
- 反向类的意思是不属于某类的内容
- 表达式[^abc]表示不是字符a或b或c的内容
a1b2c3d4.replace(/[^abc]/g, 'x');
axbxcxxx
2-3 范围类
- 正则表达式还提供了范围类
- 我们可以使用[a-z]来连接两个字符表示从a到z的任意字符
- 这个是闭区间,也就是包含a和z本身
'a1b2c3z4'.replace(/[a-z]/g, 'Q')
Q1Q2Q3Q4
- 在[]组成的类内部都是可以连写的[a-zA-Z]
'2020-12-12'.replace(/[0-9-]/g, 'A')
AAAAAAAAAA
2-4 预定义类
预定义类
- "." :除回车和换行之外的所有字符 [^\r\n]
- \d :数字字符 [0-9]
- \D :非数字字符 [^0-9]
- \s :空白符 [\t\n\x0B\f\r]
- \S :非空白符 [^\t\n\x0B\f\r]
- \w :单词字符 [a-zA-Z_0-9](字母(单词)、数字、下划线)
- \W :非单词字符 [^a-zA-Z_0-9]
边界
- ^x :以x开始
- x$ :以x结尾
- \b :单词边界
- \B :非单词边界
2-5 量词
- ? :出现零次或一次(最多出现一次)
- + :出现一次或多次(至少出现一次)
- * :出现零次或多次
- {n} :出现n次
- {n,m} :出现n~m次
- {n,} :至少出现n次
JS正则贪婪模式与非贪婪模式
贪婪模式尽可能多的匹配字符
'12345678'.replace('/\d{3,6}/, 'X')
X78
非贪婪模式 尽可能少的匹配,也就是一旦匹配成功不再继续尝试
'123456789'.match(/\d{3,5}?/g)
['123', '456', '789']
2-7 分组
分组 使用()可以达到分组的功能,使量词作用于分组
'a1b2c3d4'.replace(/([a-z]\d){3}/g, 'X')
Xd4
或 使用“|”可以达到或的效果
'ByronCasper'.replace(/Byron|Casper/g, 'X')
反向引用
'2020-11-12'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$2$3$1')
11-12-2020
忽略分组
不希望捕获某些分组,只需要在分组内加上?:
(?:Byron).(ok)
// (ok) = $1