JavaScript 正则表达式

正则表达式(Regular Expressions)是用于匹配字符串中字符组合的模式。在 JavaScript 中,正则表达式也是对象。这些模式被用于 RegExpexectest 方法, 以及 StringmatchmatchAllreplacesearchsplit 方法。

创建正则表达式的方式有两种:

// 正则表达式字面量
var re = /ab+c/;

// 使用 RegExp 对象的构造函数
var re = new RegExp("ab+c");

1. 正则表达式中的特殊字符

  • \ 为转义,通常在 \ 后面的字符不按原本的意义解释。如 /b/ 匹配字符 "b",当 b 前面添加反斜杠 /\b/,转义为匹配一个单词的边界。也可以对正则表达式功能字符的还原,/a*/ 将匹配 "a""aa""aaa"等字符(* 匹配它前面元字符 0 次或多次,),加了反斜杠后 /a\*/ 将只匹配 "a*"
  • ^ 匹配一个输入或一行的开头,/^a/ 匹配 "an A" 字符,而不匹配 "An a" 字符。
  • $ 匹配一个输入或一行的结尾,/a$/ 匹配 "An a" 字符,而不匹配 "an A" 字符。
  • * 匹配前面元字符 0 次或多次,/ba*/ 匹配 "b""ba""baa""baaa" 等字符。
  • + 匹配前面元字符 1 次或多次,/ba+/ 匹配 "ba""baa""baaa" 等字符。
  • ? 匹配前面元元字符 0 次或 1 次,/ba?/ 匹配 "b""ba" 字符。
  • (x) 匹配 x,保存 x$1...$9 的变量中。
  • x|y 匹配 xy
  • {n} 精确匹配 n 次。
  • {n,} 精确匹配 n 次及以上。
  • {m,n} 精确匹配 m ~ n 次。
  • [xyz] 字符集,匹配这个集合中的任一一个字符(或元字符)。
  • [^xyz] 不匹配这个集合中的任一一个字符。
  • [\b] 匹配一个退格符。
  • \b 匹配一个单词的边界。
  • \B 匹配一个单词的非边界。
  • \cX 这里的 X 是一个控制符,\cM/ 匹配 Ctrl-M
  • \d 匹配一个数字字符,/\d/ 相当于 /[0-9]/
  • \D 匹配一个非数字字符,/\D/ 相当于 /[^0-9]/
  • \n 匹配一个换行符。
  • \r 匹配一个回车符。
  • \s 匹配一个空白字符,包括 \n\r\f\t\v 等,相当于 /[\n\r\f\t\v]/
  • \S 匹配一个非空白字符,相当于 /[^\n\r\f\t\v]/
  • \t 匹配一个制表符。
  • \v 匹配一个垂直制表符。
  • \w 匹配一个可以组成单词的字符(包括字母、数字或者下划线)。如 [\w] 匹配 "$5.28" 中的 5,相当于 [a-zA-Z0-9]
  • \W 匹配一个不可以组成单词的字符,如 [\W] 匹配 "$5.28" 中的 $,相当于 [^a-zA-Z0-9]

2. 直接量字符

如果想在正则表达式中使用特殊的标点符号,必须在他们之前加上一个 \ 进行转义。

  • \/ 表示一个 / 直接量。
  • \\ 表示一个 \ 直接量。
  • \. 表示一个 . 直接量。
  • \* 表示一个 * 直接量。
  • + 表示一个 + 直接量。
  • ? 表示一个 ? 直接量。
  • \| 表示一个 | 直接量。
  • \( 表示一个 ( 直接量。
  • \) 表示一个 ) 直接量。
  • \[ 表示一个 [ 直接量。
  • \] 表示一个 ] 直接量。
  • \{ 表示一个 { 直接量。
  • \} 表示一个 } 直接量。

3. 字符类

将单独的直接复放进中括号([...])内就可以组合成字符类。一个字符类和它所包含的任何一个字符都匹配。正式表达式 /[abc]/ 和字母 "a""b""c" 中的任何一个都匹配,另外还可以定义否定字符类,这些类匹配的是除那些包含在中括号之内的字符外的所有字符。定义否定字符尖(^)时,要将一个 ^ 符号作为从左中括号算起的第一个字符。

由于某些字符类非常常用,所以 JavaScript 的正则表达式语法包含一些特殊字符和转义序列来表示这些常用的类。比如 \s 匹配的是空白符(包括空格符、制表符、换行符等空白符),\S 匹配的是除空白符之外的任意字符。

  • [...] 匹配位于括号之内的任意字符。
  • [^...] 匹配不在括号内的任意字符。
  • . 匹配除换行符之外的任意字符,相当于 [^\n]
  • \w 匹配任何单字字符,相当于 [a-zA-Z0-9_]
  • \W 匹配任何非单字字符,相当于 [^a-zA-Z0-9_]
  • \s 匹配任意空白符,相当于 /[\n\r\f\t\v]/
  • \S 匹配任意非空白符,相当于 /[^\n\r\f\t\v]/
  • \d 匹配任意数字,相当于 [0-9]
  • \D 匹配除数字之外的任意字符,相当于 [^0-9]
  • \b 匹配一个退格直接量(特例)。

4. 复制

用以上的正则表达式语法,可以把两位数描述成 /\d\d/,把四位数描述成 /\d\d\d\d/,但是我们还没有一种方法可以用来描述具有任意多位数的数字或者是一个字符串,这个字符串由三个字符以及跟随在字母后的一位数字构成。这些复杂的模式使用的正则表达式语法指定了改表达式中每个元素要重复出现的次数。

指定复制的字符总是出现在它们所作用的模式后面。由于某种复制类型相对常用。所以有一些特殊的字符专门用于表示它们。比如 + 匹配的就是复制前一模式一次或多次的模式下。

先看写例子:

  • /\d{2,4}/ 表示匹配 2 ~ 4 个的数字字符。
  • /\w{3}\d?/ 表示匹配三个单字字符和一个任意的数字。
  • \s+java\s+ 表示匹配字符串 "java",并且该字符串前后可以有一个或多个空格。
  • /[^"]*/ 表示匹配零个或多个非引号字符。

复制字符的几种方式:

  • {m,n} 匹配前一项至少 m 次,但是不能超过 n 次。
  • {n,} 匹配前一项 n 次及以上。
  • {n} 匹配前一项恰好 n 次。
  • ? 匹配前一项 0 次或 1 次,就是说前一项是可选的,相当于 {0,1}
  • + 匹配前一项 1 次或多次,相当于 {1,}
  • * 匹配前一项 0 次或多次,相当于 {0,}

5. 选择、分组、引用

正则表达式的语法还包括指定选择项,对子表达式分组和引用前一子表达式的特殊字符。字符 | 用于分隔供选择的字符,例如:/ab|cd|ef/ 匹配的是 "ab" 或者是 "cd" 又或者是 "ef" 字符串。再比如:/\d{3}|[a-z]{4}/ 匹配的是要么是一个三位数字,要么是四个小写字母。

在正则表达式中,括号((...))具有几种作用:
1️⃣ 它的主要作用是把单独的项目分组成子表达式,以便可以像处理一个独立的单元那种用 *+? 来处理那些项目。例如:/java(script)?/ 匹配的是字符串 "java",其后的既可以有 "script",也可以没有。再比如,/(ab|cd)+|ef/ 匹配的既可以是字符串 "ef",也可以是字符串 "ab" 或者 "cd" 的一次或多次重复。
2️⃣ 括号的第二个用途是,在完整的模式中定义子模式。当一个正则表达式成功地和目标字符串相匹配是,可以从目标串中抽出和括号中的子模式相匹配的部分。例如,假定我们正在检索的模式是一个或多个字母后面跟随一位或多位数组,你们我们可以使用模式 /[a-z]+\d+/。但是由于假定我们真正关心的是每个匹配尾部的数字,那么如果我们将模式的数字部分放在括号中 /[a-z]+(\d+)/,我们就可以从所检索到的任何匹配中抽取数字了,之后我们会对此进行解析的。
3️⃣ 代括号的另一个用途是,允许我们在同一正则表达式的后面引用前面的子表达式。这是通过在字符串 \ 后加一位或多位数字来实现的。数字指的是代括号的子表达式在正则表达式中的位置。例如:\1 引用的的是第一个代括号的子表达式,\3 引用的是第三个代括号的子表达式。注意,由于子表达式可以嵌套在其他子表达式中,所以它的位置是被计数的左括号的位置。
例如,在下面的正则表达式被指定为 \2/([Jj]ava[Ss]cript)\sis\s(fun\w*)/,对正则表达式中前一子表达式的引用所指定的并不是那个子表达式,而是与那个模式相匹配的文本。这样,引用就不只是帮助你输入正则表达式的重复部分的快捷方式了,它还实施了一条规约,那就是一个字符串各个分离的部分包含的是完全相同的字符。例如:/['"][^'"]['"]/ 匹配的就是位于单引号或者双引号之内的所有字符。但是它要求开始和结束的引号匹配。(例如两个都是双引号或者都是但引号)
如果要求开始和结束的引号匹配,我们可以使用如下的引用:/(['"])[^'"]*\1/\1 匹配的是第一个代括号的子表达式所匹配的模式。在这个例子中,它实施了一种规约,那就是开始的引号必须和结束的引号相匹配。注意,如果反斜杠后跟随的数字比代括号的子表达式数多,那么它就会被解析为一个十进制的转义序列,而不是一个引用。你可以坚持使用完整的三个字符来表示转义序列,这样就可以避免混淆了。例如 \044,而不是 \44

下面是正则表达式的选择、分组和引用字符:

  • | 选择:匹配的要么是该符号左边的子表达式,要么是它右边的子表达式。
  • (...) 分组:将几个项目分为一个单元,这个单元可由 *+?| 等符号使用,而且还可以记住和这个组匹配的字符以供此后引用使用 \n 和第 n 个(注意这里的 n 是指数字)分组所匹配的字符相匹配。分组是括号中的子表达式。(可能是嵌套的)分组号是从左到右计数的左括号数。

6. 通过标志进行高级搜索

正则表达式有六个可选参数flags)允许全局和不分大小写搜索等。这些参数既可以单独使用,也能以任意顺序一起使用,并且被包含在正则表达式实例中。

  • g 全局搜索
  • i 不区分大小写搜索
  • m 多行搜索。
  • s 允许 . 匹配换行符。
  • u 使用 unicode 码的模式进行匹配。
  • y 执行“粘性(sticky)”搜索,匹配从目标字符串的当前位置开始。
// 正则表达式字面量
var re = /pattern/flags;
// RegExp 构造函数
var re = new RegExp("pattern", "flags");

7. 动态创建正则表达式

从用户输入等来源中动态地产生,就需要使用构造函数来创建正则表达式。

// 假设需求是生成一个正则表达式:/temp/

// 此时我们手上有一个字符串 "temp"
var str = 'temp';

// 这种方式是不对的,得到的只是一个 "/temp/" 字符串。
var re = '/' + str + '/';

// 应该是这样,才是正则表达式
var re = new RegExp(str);



未完待续...

参考

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351