JS权威指南读书笔记(三)

第十章 正则表达式的模式匹配

如同对象和数组,正则表达式也有两种创建方式,构造函数和正则表达式直接量。

var pattern = /s$/;
var pattern = new RegExp("s$");
// 上面两种方式是等价的

直接量字符

正则表达式中的所有字母和数字都是按照字面含义匹配的。比如/javaScript/可以匹配任何包含"javaScript"子串的字符串。同时,正则语法也支持非字母的字符匹配,这些字符需要通过反斜线''进行转义。正则的直接量字符包括:

字符 匹配
字母和数字字符 自身
\o NUL字符
\t 制表符
\n 换行符
\v 垂直制表符
\f 换页符
\r 回车符
\xnn
\uxxxx
\cX

而且许多标点符号也有特殊意义,包括:
^ $ . * + ? = ! : | \ / ( ) { } [ ]
如果想在正则表达式使用这些字符的直接量进行匹配,那么必须使用''进行转义。

字符类

将直接量字符单独放进方括号[]内就组成了字符类。字符类可以匹配包含的任意字符。所以/[abc]/就和字母'a','b','c'的任意一个都匹配。可以通过'^'来否定字符类,它匹配所有不包含在方括号内的字符。/[^abc]/匹配的就是'a','b','c'之外的所有字符。另外,使用连字符'-'来表示字符范围。匹配小写字母,使用/[a-z]/,匹配拉丁字母中的任何字母和数字,使用/[a-zA-Z0-9]/。
由于某些字符类很常用,所以语法使用了写特殊字符的转义字符来表示它们,具体见下表。

字符 匹配
. 除换行符和其他Unicode行终止符之外的任意字符
\w 任何ASCII字符组成的单词,等价于[a-zA-Z0-9]
\W 等价于[^a-zA-Z0-9]
\s 任何Unicode空白符
\S 任何非Unicode空白符的字符
\d [0-9]
\D [^0-9]
[\b] 退格直接量

举个🌰,/[\s\d]/可以匹配任意空白符或者数字。

重复

在正则模式之后跟随用于指定字符重复的标记,下面是一些专门用于表示重复情况的特殊字符。

字符 含义
{n,m} 匹配前一项至少n次,但不能超过m次
{n,} 匹配前一项n次或者更多次
{n} 匹配前一项n次
? 匹配前一项0或者1次,等价于{0,1}
+ 匹配前一项1次或者多次,等价于{1,}
* 匹配前一项0次或者多次,等价于{0,}

举几个例子:

/\d{2,4}/  //匹配2~4个数字
/\w{3}\d?/  //匹配三个单词和一个可选的数字
/\s+javascript\s+/  //匹配前后带有一个或多个空格的字符串'javascript'
/[^(]*/  //匹配0个或多个非左括号的字符
//原书中是匹配一个或多个非左括号的字符,可能有误,或者我理解错了?

在使用'*'和'?'的时候要注意,他们可能匹配0个字符,所以允许什么都不匹配。例如:/a*/表示匹配0次或者多次字符串a,所以与字符串'bcd'也是匹配的,因为含有0个a。

选择、分组和引用

正则表达式的语法还包括指定选择项、子表达式分组和引用前子表达式的特殊字符。
其中字符“|”用于分隔供选择的字符。比如。/ab|cd/可以匹配'ab'也可以匹配'cd'。
需要注意的是,选择项的匹配次序是从左到右,直到发现了匹配项。如果左边的选项匹配,那么就会忽略右边的匹配项。这个操作有没有似曾相识?是的,就是js的短路运算(||)。因此,当/a|ab/匹配“ab”时,只会匹配第一个字符。
再一个字符就是圆括号"()"。一个作用是把单独的项组合成子表达式,以便可以像处理一个独立的单元那样用"|"、"*"、"+"或者"?"来对单元内的项进行处理。比如:/java(script)?/可以匹配'java',也可以匹配'javascript'。/(ab|cd)+|ef/可以匹配'ef',也可以匹配'ab'或'cd'一次或多次。
带圆括号的表达式的另一个用途是允许在同一正则表达式的后部引用前面的子表达式。

指定匹配位置

使用锚元素将模式定位在搜索字符串的特定位置上。其中最常用的是使用'^'匹配字符串的开始,使用'$'匹配字符串的结束。
任意正则表达式都可以作为锚点条件。如果在符号"(?="和")"之间加入一个表达式,它就是一个先行断言,用来说明圆括号内的表达式必须正确匹配,但并不是真正意义上的匹配。比如。要匹配一种常用的程序设计语言的名字,只在其后又冒号时才匹配。这时就可以使用/[Jj]ava([Ss]cript)?(?=\:)/。这个正则就只能匹配后面后冒号的字符串。
带有"(?!"的断言是负向先行断言,用以指定接下来的字符都不必匹配。
下表是正则表达式中的锚字符:

字符 含义
^ 匹配字符串的开头,在多行检索中,匹配一行的开头
$ 匹配字符串的结尾,在多行检索中,匹配一行的结尾
\b 匹配一个单词的边界,就是位于字符\w和\W之间的位置,或位于字符\w和字符串的开头或者结尾之间的位置
\B 匹配非单词边界的位置
(?=p) 零宽正向先行断言,要求接下来的字符都和p匹配,但不能包括匹配p的那些字符
(?!p) 零宽负向先行断言,要求接下来的字符不与p匹配

修饰符

修饰符是放在"/"符号之外的,出现在第二条斜线之后。一共有三个修饰符,修饰符"i"用来说明模式匹配是不区分大小写的。修饰符"g"说明模式匹配是全局的。修饰符"m"用来在多行模式中执行匹配,在这种模式下,如果待检索的字符串包含多行,那么^和$锚字符除了匹配整个字符串的开始和结尾之外,还能匹配每行的开始和结尾。

用于模式匹配的String方法

String一共有4中使用正则表达式的方法,包括search()、replace()、match()和split()。

1.search()

search()的参数是一个正则表达式,返回第一个与之匹配的子串的起始位置,如果找不到匹配的子串,它将返回-1。举个例子:

"JavaScript".search(/script/i);
 // 返回4

如果search()的参数不是正则表达式,首先会通过RegExp构造函数将它转换为正则表达式,search()方法不支持全局检索,因为会忽略正则表达式参数中的修饰符g。

2.replace()

该方法用以执行检索和替换操作。其中第一个参数是一个正则表达式,第二个参数是要进行替换的字符串。如果正则表达式中设置了修饰符g,那么源字符串中所有与模式匹配的子串都将替换成第二个参数指定的字符串;如果不带修饰符g,则只替换所匹配的第一个子串。如果replace()的第一个参数是字符串而不是正则表达式,那么replace()将直接搜索这个字符串,而不会向search()一样先转换为正则表达式。举个例子:

str.replace(/javascript/gi,"JavaScript");
//将所有不区分大小写的javascript替换成JavaScript

3.match()

match()方法的唯一参数就是一个正则表达式,返回的是一个由匹配结果组成的数组。如果该正则表达式设置了修饰符g,则该方法返回的数组包含字符串的所有匹配结果。比如:

"1 plus 2 equals 3".match(/\d+/g)
// 返回 ["1","2","3"]

如果没有设置修饰符g,那么就不会进行全局检索,只检索第一个匹配。但是即使match()执行的不是全局检索,也返回一个数组。这时,数组的第一个元素就是匹配的字符串,余下的元素则是正则表达式中用圆括号括起来的子表达式。

4.split()

该方法用以将调用它的字符串拆分为一个子串组成的数组,分隔符就是方法的参数。例如:

'123456'.split('');
// 将'123456'使用空字符串''进行分割
// 返回["1", "2", "3", "4", "5", "6"]

split()的参数也可以是一个正则表达式。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容