JavaScript 正则表达式完整介绍

一 : 语法规则

1.RegExp构造函数创建了一个正则表达式对象,用于将文本与一个模式匹配

2.RegExp 由两个部分组成

    ①pattern(正则表达式的文本)

    ② flags (正则表达匹配规则描述)

            g:全局匹配;找到所有匹配,而不是在第一个匹配后停止

            i:忽略大小写

            m:多行; 将开始和结束字符(^和$)视为在多行上工作(也就是分别匹配每一行的开始和结束(由 \n 或 \r分割),而不只是只匹配整个输入字符串的最开始和最末尾处。

   u:Unicode; 将模式视为Unicode序列点的序列

            y:粘性匹配; 仅匹配目标字符串中此正则表达式的lastIndex属性指示的索引(并且不尝试从任何后续的索引匹配)

 正则实例: /^[a-zA-z]+\.[a-zA-z]+\.(cn|com|info|top)/gi   域名匹配。


二: 创建形式(两种方式)

1.字面量 eg:  var a =  /^1\d{2}-\d{4}-\d{4}/g(电话号码匹配)

2.构造函数 eg: var a =  new RegExp( /^1\d{2}-\d{4}-\d{4}/g)


三:表达式中特殊字符的含义

字符类别(Character Classes)

字符含义


.(点号,小数点) 匹配任意单个字符,但是行结束符除外:\n\r\u2028或\u2029。

在字符集中,点( . )失去其特殊含义,并匹配一个字面点( . )。

需要注意的是,m多行(multiline)标志不会改变点号的表现。因此为了匹配多行中的字符集,可使用[^](当然你不是打算用在旧版本 IE 中),它将会匹配任意字符,包括换行符。

例如,/.y/匹配 "yes make my day" 中的 "my" 和 "ay",但是不匹配 "yes"。

\d匹配任意阿拉伯数字。等价于[0-9]。

例如,/\d/或/[0-9]/匹配 "B2 is the suite number." 中的 '2'。

\D匹配任意一个不是阿拉伯数字的字符。等价于[^0-9]。

例如,/\D/或/[^0-9]/匹配 "B2 is the suite number." 中的 'B'。

\w匹配任意来自基本拉丁字母表中的字母数字字符,还包括下划线。等价于[A-Za-z0-9_]。

例如,/\w/匹配 "apple" 中的 'a',"$5.28" 中的 '5' 和 "3D" 中的 '3'。

\W匹配任意不是基本拉丁字母表中单词(字母数字下划线)字符的字符。等价于[^A-Za-z0-9_]。

例如,/\W/或/[^A-Za-z0-9_]/匹配 "50%" 中的 '%'。

\s匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格。

等价于[ \f\n\r\t\v​\u00a0\u1680​\u180e\u2000​\u2001\u2002​\u2003\u2004​ \u2005\u2006​\u2007\u2008​\u2009\u200a​\u2028\u2029​​\u202f\u205f​ \u3000]。

例如/\s\w*/匹配 "foo bar" 中的 ' bar'。

\S匹配一个非空白符。等价于[^ \f\n\r\t\v​\u00a0\u1680​\u180e\u2000​\u2001\u2002​\u2003\u2004​ \u2005\u2006​\u2007\u2008​\u2009\u200a​\u2028\u2029​\u202f\u205f​\u3000]。

例如,/\S\w*/匹配 "foo bar" 中的 'foo'。

\t匹配一个水平制表符(tab)

\r匹配一个回车符(carriage return)

\n匹配一个换行符(linefeed)

\v匹配一个垂直制表符(vertical tab)

\f匹配一个换页符(form-feed)

[\b]匹配一个退格符(backspace)(不要与\b混淆)

\0匹配一个 NUL 字符。不要在此后面跟小数点。

\cXX是 A - Z 的一个字母。匹配字符串中的一个控制字符。

例如,/\cM/匹配字符串中的 control-M。

\xhh匹配编码为hh(两个十六进制数字)的字符。

\uhhhh匹配 Unicode 值为hhhh(四个十六进制数字)的字符。

\对于那些通常被认为字面意义的字符来说,表示下一个字符具有特殊用处,并且不会被按照字面意义解释。

例如/b/匹配字符 'b'。在 b 前面加上一个反斜杠,即使用/\b/,则该字符变得特殊,以为这匹配一个单词边界。

对于那些通常特殊对待的字符,表示下一个字符不具有特殊用途,会被按照字面意义解释。

例如,* 是一个特殊字符,表示匹配某个字符 0 或多次,如/a*/意味着 0 或多个 "a"。 为了匹配字面意义上的*,在它前面加上一个反斜杠,例如,/a\*/匹配 'a*'。

字符集合(Character Sets)

字符含义


[xyz]一个字符集合,也叫字符组。匹配集合中的任意一个字符。你可以使用连字符'-'指定一个范围。

例如,[abcd] 等价于 [a-d],匹配"brisket"中的'b'和"chop"中的'c'。

[^xyz]一个反义或补充字符集,也叫反义字符组。也就是说,它匹配任意不在括号内的字符。你也可以通过使用连字符 '-' 指定一个范围内的字符。

例如,[^abc]等价于[^a-c]。第一个匹配的是 "bacon" 中的'o' 和 "chop" 中的 'h'。

边界(Boundaries)

字符含义


^匹配输入开始。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。

例如,/^A/不匹配 "an A" 中的 "A",但匹配 "An A" 中的 "A"。

$匹配输入结尾。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。

例如,/t$/不匹配 "eater" 中的 "t",但匹配 "eat" 中的 "t"。

\b匹配一个零宽单词边界(zero-width word boundary),如一个字母与一个空格之间。 (不要和[\b]混淆)

例如,/\bno/匹配 "at noon" 中的 "no",/ly\b/匹配 "possibly yesterday." 中的 "ly"。

\B匹配一个零宽非单词边界(zero-width non-word boundary),如两个字母之间或两个空格之间。

例如,/\Bon/匹配 "at noon" 中的 "on",/ye\B/匹配 "possibly yesterday." 中的 "ye"。

分组(Grouping)与反向引用(back references)

字符含义


(x)匹配x并且捕获匹配项。 这被称为捕获括号(capturing parentheses)。

例如,/(foo)/匹配且捕获 "foo bar." 中的 "foo"。被匹配的子字符串可以在结果数组的元素[1], ..., [n]中找到,或在被定义的RegExp对象的属性$1, ..., $9中找到。

捕获组(Capturing groups)有性能惩罚。如果不需再次访问被匹配的子字符串,最好使用非捕获括号(non-capturing parentheses),见下面。

\nn是一个正整数。一个反向引用(back reference),指向正则表达式中第 n 个括号(从左开始数)中匹配的子字符串。

例如,/apple(,)\sorange\1/匹配 "apple, orange, cherry, peach." 中的 "apple,orange,"。一个更全面的例子在该表格下面。

(?:x)匹配x不会捕获匹配项。这被称为非捕获括号(non-capturing parentheses)。匹配项不能够从结果数组的元素[1], ..., [n]或已被定义的RegExp对象的属性$1, ..., $9再次访问到。

数量词(Quantifiers)

字符含义


x*匹配前面的模式x0 或多次。

例如,/bo*/匹配 "A ghost booooed" 中的 "boooo","A bird warbled" 中的 "b",但是不匹配 "A goat grunted"。

x+匹配前面的模式x1 或多次。等价于{1,}。

例如,/a+/匹配 "candy" 中的 "a","caaaaaaandy" 中所有的 "a"。

x*?

x+?

像上面的 * 和 + 一样匹配前面的模式x,然而匹配是最小可能匹配。

例如,/".*?"/匹配 '"foo" "bar"' 中的 '"foo"',而 * 后面没有 ? 时匹配 '"foo" "bar"'。

x?匹配前面的模式x0 或 1 次。

例如,/e?le?/匹配 "angel" 中的 "el","angle" 中的 "le"。

如果在数量词*、+、?或{}, 任意一个后面紧跟该符号(?),会使数量词变为非贪婪( non-greedy) ,即匹配次数最小化。反之,默认情况下,是贪婪的(greedy),即匹配次数最大化。

在使用于向前断言(lookahead assertions)时,见该表格中(?=)、(?!)和(?:)的说明。

x(?=y)只有当x后面紧跟着y时,才匹配x。 例如,/Jack(?=Sprat)/只有在 'Jack' 后面紧跟着 'Sprat' 时,才会匹配它。/Jack(?=Sprat|Frost)/只有在 'Jack' 后面紧跟着 'Sprat' 或 'Frost' 时,才会匹配它。然而,'Sprat' 或 'Frost' 都不是匹配结果的一部分。

x(?!y)只有当x后面不是紧跟着y时,才匹配x。例如,/\d+(?!\.)/只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。

/\d+(?!\.)/.exec("3.141")匹配 141 而不是 3.141。

x|y匹配xy

例如,/green|red/匹配 "green apple" 中的 ‘green',"red apple." 中的 'red'。

x{n}n是一个正整数。前面的模式x连续出现 n 次时匹配。

例如,/a{2}/不匹配 "candy," 中的 "a",但是匹配 "caandy," 中的两个 "a",且匹配 "caaandy." 中的前两个 "a"。

x{n,}n是一个正整数。前面的模式x连续出现至少 n 次时匹配。

例如,/a{2,}/不匹配 "candy" 中的 "a",但是匹配 "caandy" 和 "caaaaaaandy." 中所有的 "a"。

x{n,m}nm为正整数。前面的模式 x 连续出现至少 n 次,至多 m 次时匹配。

例如,/a{1,3}/不匹配 "cndy",匹配 "candy," 中的 "a","caandy," 中的两个 "a",匹配 "caaaaaaandy" 中的前面三个 "a"。注意,当匹配 "caaaaaaandy" 时,即使原始字符串拥有更多的 "a",匹配项也是 "aaa"。

断言(Assertions)

字符含义


x(?=y)仅匹配被y跟随的x。

举个例子,/Jack(?=Sprat)/,如果"Jack"后面跟着sprat,则匹配之。

/Jack(?=Sprat|Frost)/,如果"Jack"后面跟着"Sprat"或者"Frost",则匹配之。但是,"Sprat" 和"Frost" 都不会在匹配结果中出现。

x(?!y)仅匹配不被y跟随的x。

举个例子,/\d+(?!\.)/只会匹配不被点(.)跟随的数字。

/\d+(?!\.)/.exec('3.141') 匹配"141",而不是"3.141


四 : 正则对象的属性和内置方法

1: 属性

注意,RegExp对象的几个属性既有完整的长属性名,也有对应的类 Perl 的短属性名。两个属性都有着同样的值。JavaScript 的正则语法就是基于 Perl 的。

RegExp.prototype.constructor

  创建该正则对象的构造函数。

RegExp.prototype.global

  是否开启全局匹配,也就是匹配目标字符串中所有可能的匹配项,而不是只进行第一次匹配。

RegExp.prototype.ignoreCase

  在匹配字符串时是否要忽略字符的大小写。

RegExp.prototype.lastIndex

  下次匹配开始的字符串索引位置。

RegExp.prototype.multiline

  是否开启多行模式匹配(影响 ^ 和 $ 的行为)。

RegExp.prototype.source

  正则对象的源模式文本。 

RegExp.prototype.sticky

  是否开启粘滞匹配。

RegExp.length 

  RegExp.length值为 2。

2: 方法  

RegExp.prototype.exec()

  在目标字符串中执行一次正则匹配操作。

RegExp.prototype.test()

  测试当前正则是否能匹配目标字符串。

RegExp.prototype.toSource()

        返回一个字符串,其值为该正则对象的字面量形式。覆盖了Object.prototype.toSource方法.

RegExp.prototype.toString()

  返回一个字符串,其值为该正则对象的字面量形式。覆盖了

Object.prototype.toString()方法。


四 : 正则实例

  1:邮箱匹配:/^([a-zA-Z]|\d)*@[a-zA-Z]+\.[a-zA-Z]+$/gi

  2:手机号码: /^1\d{2}-\d{4}-\d{4}$/g

  3:链接:/^(http|https):\\\\[a-zA-Z]+\.([a-zA-Z]|\d)+\.(cn|com):\d*\\.*$/g

  4:日期格式 :/^\d{4}-\d{1,2}-\d{1,2}$/g

  5:强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):/^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$/五

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,099评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,828评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,540评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,848评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,971评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,132评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,193评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,934评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,376评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,687评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,846评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,537评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,175评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,887评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,134评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,674评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,741评论 2 351