知识学到自己手里的才是自己的,如果复制,粘贴别人的对自己帮助并不大,它只能帮自己解决一时的问题(有时还要花费自己大量的时间来查找),而不能从根本上解决问题。
就好像前段时间我的的大学同学问了我一个正则问题,如何验证用户输入的密码必须包含字符、数字、特殊符号,他说在百度上找了大量的正则示例都不能解决问题,我就问然后呢,他给我说我问你,我当时就无语了,我当时因为正在做项目,一时没想出来,我跟他说你没试着换个思路,暂时没有找到用一个正则解决这个问题的你就不会试着分别对字符,数字,特殊字符单独判断,然后进行与运算不就行了,再者说了从用户体验上用一个正则判断后给出一个结果,用户体验也不好,应该针对用户输入不同的情况给出不同的提示信息,如果密码的组成没有数字,就提示没有数字,如果没有字符就提示没有字符...... , 如果以此类推觉得判断过多,你可以再简化处理,如只有密码组成包含两种,就提示缺少的一种,如果密码组成只包含一种,就提示密码应该有字符、数字、特殊符号组成。
这无形中给我上了生动的一课,正则不仅其他人忽视了,我也忽视了,有所欠缺。所以尽管最近在努力拿下设计模式这个高地,还是决定抽出一部分时间梳理一下自己的正则知识的掌握。
具有特殊含义的字符
下面只列出常用的字符,以及我个人对它们的分类。
分组和集合
-
()
: 括号内的表达式表示一个分组 -
[]
: 方括号内的表达式表示一个集合
运算符
-
^
: 如果出现在集合([]
)中表示取反,否则是是定位符,从字符串的前边界开始匹配 -
|
:它表示或的意思,就是起到或运算的作用 -
?:
: 它的作用是放在第一个选项前来消除相关匹配会被缓存这种副作用
定位符
-
^
: 上面已经说了它定义正则运算的前边界 -
$
: 它定义了正则运算的后边界 -
\b
: 匹配一个字符的边界(也即是字符和空白字符的分界)
字符类(代表一类字符)
-
\d
: 代表数字,而\D
,非数字 -
\w
: 代表单词,而\W
,非单词 -
\s
: 代表空白符,而\D
,非空白字符 -
.
: 任意字符
限定符
它是用来指定匹配结果的长度或次数。
匹配该符号前面的表达式
+
: 一次或更多次*
:零次或多次?
: 零次或一次-
{}
: 匹配次数与话括号内的值有关。如果
{n}
,就是匹配n次;
如果{n,}
,就是匹配至少n次;
如果{n,m}
,就是匹配n到m之间的任意次数。
如何玩转正则
正则用在字符串的处理上,可以减少我们的js代码的书写量,优化我们的代码,同时对于我们学习别人源码中复杂的正则已有帮助。
下面是一张来自知乎关于你是如何学会正则表达式的?问题的一张图,掌握这张图的正则,大概你就能解决你所面临的大部分问题。
/^\s*[A-Za-z_$][\w$]*(?:\.[A-Za-z_$][\w$]*|\['*?'\]|\[".*?"\]|\[\d+\]|\[[A-Za-z_$][\w$]*\])*\s*$/
下面推荐几款可视化的正则编辑器。
regexper (这是我最早接触到的一款)
Regulex (这一款是我现在经常使用的)
RegExr (这一款功能很强大,对于学习正则很有帮助,如果学习正则的话强烈推荐)
js如何使用
正则是一个很强大的字符串查询和替换的方法。
以前我们有时侯总是在想将字符串转换为数字数组,利用数组的方法来处理字符,但是要知道字符串就是我们在生活和工作中常见的形式,数字、数组、Boolean类型的相对较少,尤其是最近在做微信开发时发现正则很重要,我同学的例子,只是给了我一个深入学习和研究的动力,这只是我的初步总结,以后有必要的话还会加强。
在JavaScript中我们使用 RegExp
来创建一个对象来实现正则表达式。
基本定义
一个正则有两部分组成:正则主体和修饰符。
形式如下:
regExp = new RegExp('pattern', 'flag');
// 或者
regExp = /pattern/gmi
正则的修饰符一共有5种,分别为:
-
g
: 所有匹配的情况,如果没有它,只一种匹配情况 -
i
: 忽略字符的大小写 -
m
: 支持多行 -
u
: 支持 Unicode -
y
: 严格模式(返回指定位置后的匹配结果)
正则对象的一些方法
regexp.test(str)
test
方法返回值为true/false
let str = "Hello world!";
let regexp = /hello/i;
console.log(regexp.test(str));
regexp.exec(str)
由于这个方法不好用,所以很少有人使用。
let str = "Hello world!";
let regexp = /l(o)/ig; // 如果用exec返回所有的的匹配结果需要加上 ‘g’ 修饰符
let matchOne = regexp.exec(str);
console.log(matchOne[0]); // lo
console.log(matchOne[1]); // o
console.log(matchOne.index); // 3
console.log(matchOne.input); // Hello world!
console.log(matchOne.lastIndex); // 5
如果没有匹配返回null
js中String可以使用正则的方法
在String的方法中使用正则,可以轻松的解决我们日常开发中的问题。
str.search()
如果有匹配结果,返回第一个匹配结果的首字符位置;否则,返回 `-1`。
let str = "Hello world!";
regexp = /o/i;
str.search(regexp); // 4
注;search
只能返回第一次匹配的结果,而不能返回其他匹配结果
str.match(str|reg)
let str = "Hello world!";
regexp = /o/i;
let result = str.match(regexp);
console.log(result[0]); // o
console.log(result.index); // 4
console.log(result.input); // Hello world!
我们发现 str.match()
的用法和 regexp.exec()
返回的结果很一样,其实match的底层实现就是 regexp.exec()
,使用也一样,注意修饰符 g
。
str.split(reg|substr, limit)
将给定的字符串按单词为单位进行分割,返回一个由单词组成的数组。
let str = 'Hello world, my name is lzb.'
let regexp = /\s+/i;
str.split(regexp); // ["Hello", "world,", "my", "name", "is", "lzb."]
str.split(regexp, 3) // ["Hello", "world,", "my"]
在这个字符串的方法中第二参数限制返回结果数组的长度。
在返回的结果中,我们发现有的单词带有特殊符号,下面一个字符串方法将实现清除特殊符号。
str.replace(str|reg, str|func)
如果要实现上面示例的清除字符中特殊符号的目标,我们可以使用 str.replace()
,效果如下:
let str = 'Hello world, my name is lzb.'
let regexp = /[.,\/#!$%\^&\*;:{}=\-_`~()]/g;
str.replace(regexp, ''); // "Hello world my name is lzb"
或者
let str = 'Hello world, my name is lzb.'
let regexp = /[^\w\s|-]/g;
str.replace(regexp, ''); // "Hello world my name is lzb"
然后,接着使用上面的 str.split()
方法即可,或者有同学可能想到如下方法:
let str = 'Hello world, my name is u-lzb.'
let regexp = /[^\w]+/g;
str.split(regexp); // ["Hello", "world", "my", "name", "is", "u", "lzb", ""]
这种方法不建议使用,问题很明显,这里就不多说了。
我们发现上面实现清除字符串中特殊符号的方法有两种,这两种方法谈不上孰优孰劣,它们各有优势。如果在我们把字符串中 work_up
, call&apply
,::arg
,a=b
… 都当作特殊的单词,我们就需要第一种方法;如果我们就是要中规中矩的单词我们可以使用第二种方法。
如果第二个参数是func,介绍一个例子,字符串中单词的首字母大写:
let str = 'hello world';
str.replace(/\b\w+\b/g, (word) => word.substring(0,1).toUpperCase() + word.substring(1) );
字符串还有 length
,indexOf
,concat
,toLowerCase
,toUpperCase
等方法,这里就不一一介绍了。
推荐
如果喜欢码题的同学可到https://www.hackerrank.com/domains/regex/re-introduction这个网站去。