正则表达式（Regular expression）

正则表达式：是处理字符串的一种表达方式，提供了一种从一组字符串中选择特定字符串的机制
POSIX规范定义了 UNIX 操作系统支持的功能，POSIX 规范的正则表达式有两种：

BRE (Basic Regular Expression) -- 基本型正则表达式
ERE (Extended Regular Expression) -- 扩展型正则表达式

这里需要注意一点：正则表达式和通配符没有任何关系，不是包含关系
1、通配符是Shell提供的功能
2、正则表达式只是用来处理字符串

下面我们来看一个常见的正则表达式，手机号码的判断：

^1[3-9](\d{9})$

^：锚点操作符，匹配字符串的开头，这里紧跟着1表示以1开头的字符串
[]：列表操作符，只匹配中括号中的一个字符
-：范围操作符，指定的范围。3-9表示范围在3和9之间
\d：代表0-9之间的数字
{}：间隔运算符，匹配前一个元素N次，这里表示匹配前一个元素9次
$锚点操作符，匹配字符串的结尾

字符匹配

我们先来看一些常见的字符

字符	描述
`[ABC]`	匹配`[...]`中的所有字符，例：`[qaz]`匹配字符串"Tiktok Byte Dance"中所有的`q a z`字母
`[^ABC]`	匹配除了`[...]`中字符的所有字符，与 `[ABC]`相反
`[A-Z]`	`[A-Z]`表示一个区间，匹配所有大写字母，`[a-z]`表示所有小写字母
`.`	匹配所有字符，除了`\n` `\r`和null(空字符)，相当于[^\n\r]
\w	匹配字母、数字、下划线。等价于[A-Za-z0-9]

重复操作符

字符	描述
`*`	匹配前一个元素 0 次或多次
`+`	匹配前一个元素 1 次或多次
`?`	匹配前一个元素 0 次或 1次

间隔操作符

字符	描述
`{N}`	匹配前一个元素 N 次，N是一个非负整数
`{min,}`	匹配前一个元素至少 min 次，min是一个非负整数
`{min,max}`	匹配前一个元素至少 min 次，至多 max 次；min和max均为非负整数，`注意逗号和两个数之间不能有空格`

列表操作符
[...] & [^...]
一般操作符在列表操作符里会失去特殊意义，除了：

字符	描述
`]`	结束列表`[]]`
`\`	转义字符
`[:`	字符类别操作符开始
`:]`	字符类别操作符结束
`-`	范围操作符，如`0-9`

字符类别操作符

字符	匹配类型	描述
`[:alnum:]`	[A-Za-z0-9]	匹配数字和字母
`[:alpha:]`	[A-Za-z]	匹配字母
`[:blank:]`	[\t]	匹配空格和 Tab
`[:cntrl:]`	[\x00-\x1F\x7F]	匹配控制符
`[:digit:]`	[0-9]	匹配数字
`[:graph:]`	\x21-\x7E	匹配可视字符
`[:lower:]`	[a-z]	匹配小写字母
`[:print:]`	[\x20-\x7E]	匹配可视字符和空格
`[:punct:]`	][!"#$%&'()*+,./:;<=>?@^_`{}·~-]	匹配标点符号
`[:space:]`	[\t\r\n\v\f]	空白字符
`[:upper:]`	[A-Z]	匹配大写字母字符
`[:xdigit:]`	[A-Fa-f0-9]	匹配十六进制字符

特殊类别操作符

字符	匹配类型	描述
`\w`	[:alnum:]	匹配数字和字母
`\d`	[:digit:]	匹配数字
`\W`	[^[:alnum:]]	匹配除了数字和字母
`\B`	[^[:digit:]]	匹配除了数字
`\<`	^	匹配字符串的开头
`\>`	$	匹配字符串的结尾
`\b`	匹配单词边界字符，to\b，但是不匹配tomorrow

锚点操作符

字符	描述
`^`	匹配字符串的开头，需在开头
`$`	匹配字符串的结尾或换行符的前一个位置，需在结尾

⚠️ 注意：如果^在列表操作符中使用，并且在首位，代表取反

操作符的优先级

优先级（由高到低）	操作符
归类相关的括号符号	`[::]`
转义字符	`\<特殊字符>`
括号表达	`[]`
分组	`()`
单字符重复	`*` `+` `?` `{m,n}`
串联	`.`
锚点	`^` `$`
备选	`竖线(Markdown语法冲突，无法描述)`

贪婪模式、勉强模式、侵占模式

贪婪匹配	勉强匹配	侵占匹配	描述
`X?`	`X??`	`X?+`	匹配`X`零次或一次
`X*`	`X*?`	`X*+`	匹配`X`零次或多次
`X+`	`X+?`	`X++`	匹配`X`一次或多次
`X{n}`	`X{n}?`	`X{n}+`	匹配`X`n次
`X{n,}`	`X{n,}?`	`X{n,}+`	匹配`X`至少n次
`X{n,m}`	`X{n,m}?`	`X{n,m}+`	匹配`X`至少n次，但不超过m次

贪婪模式

例子：GoogleMaps

模式：.*aps(贪婪模式) 由两部分组成
1、p1(.*) ：匹配方式为贪婪型
2、p2(aps)
匹配开始：
第一轮：
首先，p1会匹配字符串中的所有字符GoogleMaps，匹配成功；但是p2没有匹配字符，本轮匹配失败。
第二轮：
减少p1的匹配量，留出最后一个字符，那么此时存在两个字符串：s1代表GoogleMap / s2代表s。此时s1匹配p1，但是s2不匹配p2，本轮匹配失败。
第三轮：
继续减少p1的匹配量，留出两个字符，结果同第二轮一样。
第四轮：
再次减少p1的匹配量，字符串被分割成GoogleM 和 aps两个部分，此时p1和p2都能匹配。返回匹配成功。

勉强模式

例子：GoogleMaps

模式：.*?aps(勉强模式) 最小匹配方式，同样的分为两部分
1、p1(.*?) ：匹配方式为勉强模式
2、p2(aps)
匹配开始：
第一轮：p1由于是0次和任意次，首次匹配0次；则直接用字符串去匹配p2，但是p2无法匹配字符，本轮匹配失败。
第二轮：
增加p1的匹配量，匹配G；此时存在两个字符串，s1代表G / s2代表oogleMaps，s1匹配p1，但是s2不匹配p2，本轮匹配失败。
继续上述匹配，直到满足p2

侵占模式

例子：`GoogleMaps

模式：.*+aps(侵占模式) ，同样的分为两部分
1、p1(.*+) ：匹配方式为勉强模式
2、p2(aps)
匹配开始时读入所有字符串，和p1匹配成功；但没有剩余字符串去和p2匹配，匹配失败。

简单讲，贪婪模式和侵占模式相比，
1、贪婪模式会在只有部分匹配成功的条件下，依次从多到少，减少匹配成功部分的匹配量，将字符留给其他部分去匹配
2、而侵占模式则是占有所有能匹配成功的部分，绝不留给其他部分使用

iOS中正则表达式的应用

NSString *phoneNum = @"1384587921";
    NSError *error = NULL;
    NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"^1[3-9]([:digit:]{9})$" options:NSRegularExpressionCaseInsensitive error:&error];
    NSTextCheckingResult *result = [regex firstMatchInString:phoneNum options:0 range:NSMakeRange(0, [phoneNum length])];
    
    if (result) {
        NSLog(@"匹配成功");
    } else {
        NSLog(@"匹配失败");
    }

⚠️⚠️⚠️ 注意：正则表达式在不同的开发环境中是有所区别的，这一点需要在实际开发中灵活应用，比如：

image.png

在iOS的环境下，\d是不识别的。
这是因为OC 和 Swift 都要求转义文字字符串中的特殊字符（即：在它们前面加上反斜杠\）。反斜杠本身就是这样的特殊字符之一，由于用于创建正则表达式的模式也是字符串，因此会增加复杂性，因为在使用Stingand时需要转义反斜杠字符NSRegularWxpression。

这也就意味着标准正则表达式\d，将以\\d的形式出现在Swift 或 OC 代码中。这一点大家要注意！

^1[3-9](\\d{9})$

参考文档：正则表达式 - 语法

最后编辑于：2021.03.04 13:53:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,684评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,143评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,214评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,788评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,796评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,665评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,027评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,679评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,346评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,664评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,766评论 1赞 331
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,412评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,015评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,974评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,073评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,501评论 2赞 343