正则表达式的使用

参考链接:https://tool.oschina.net/uploads/apidocs/jquery/regexp.html

特殊字符-限定符

*: 表示前面的字符可以出现0次或多次
+: 表示前面的字符至少出现一次
: 表示前面的字符最多出现一次
: 表示前面的字符最多出现一次
{n}: n 是一个非负整数。匹配确定的 n 次
{n,}: n 是一个非负整数。至少匹配n 次
{n,m}: m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。

NSArray *data = @[
    @"abdef",
    @"abcdef",
    @"abccdef",
    @"abcccdef",
    @"abcgdef"
];
NSString *regeStr = @"abc*def";

NSPredicate* pre_text = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regeStr];

for (NSString *text in data) {
    if ([pre_text evaluateWithObject:text]) {
        NSLog(@"%@ 匹配正确",text);
    } else {
        NSLog(@"%@ 匹配错误",text);
    }
}

abc*def 的输出结果:
abdef 匹配正确
abcdef 匹配正确
abccdef 匹配正确
abcccdef 匹配正确
abcgdef 匹配错误

abc+def 的输出结果:
abdef 匹配错误
abcdef 匹配正确
abccdef 匹配正确
abcccdef 匹配正确
abcgdef 匹配错误

abc?def 的输出结果:
abdef 匹配正确
abcdef 匹配正确
abccdef 匹配错误
abcccdef 匹配错误
abcgdef 匹配错误

abc{2}def 的输出结果:
abdef 匹配错误
abcdef 匹配错误
abccdef 匹配正确
abcccdef 匹配错误
abcgdef 匹配错误

abc{2,}def 的输出结果:
abdef 匹配错误
abcdef 匹配错误
abccdef 匹配正确
abcccdef 匹配正确
abcgdef 匹配错误

abc{1,2}def 的输出结果:
abdef 匹配错误
abcdef 匹配正确
abccdef 匹配正确
abcccdef 匹配错误
abcgdef 匹配错误

区间符

[],(),{}:都是表达式的意思,如果要匹配单独的括号字符需要在前面加\,比如\[等。
():是为了提取匹配字符串的,表达式中有几个()就有几个相应的匹配字符串
[]:是定义匹配的字符范围,比如[1-9],相当于匹配1到9之间的一个数。
{}:是一个区间,就像上面的{n,m}匹配n到m个数。

NSArray *data = @[
    @"0",
    @"1",
    @"12",
    @"123"
];
NSString *regeStr = @"[1-9]";

NSPredicate* pre_text = [NSPredicate predicateWithFormat:@"SELF MATCHES %@", regeStr];

for (NSString *text in data) {
    if ([pre_text evaluateWithObject:text]) {
        NSLog(@"%@ 匹配正确",text);
    } else {
        NSLog(@"%@ 匹配错误",text);
    }
}

regeStr = [1-9] 输出结果:
// 匹配1到9的一位数
0 匹配错误
1 匹配正确
12 匹配错误
123 匹配错误

regeStr = [1-9]* 输出结果:
// 匹配多位数要求不包含有0
0 匹配错误
1 匹配正确
12 匹配正确
123 匹配正确

regeStr = [1-9][1-9] 输出结果:
// 匹配两位数要求不包含有0
0 匹配错误
1 匹配错误
12 匹配正确
123 匹配错误

regeStr = [0-9][1-9]* 输出结果:
// 匹配多位数,第二位开始不为0
0 匹配错误
1 匹配正确
12 匹配正确
123 匹配正确
1230 匹配错误
0123 匹配正确

regeStr = [0-9][1-9]{1,2} 输出结果:
// 匹配二位数或者三位数,第二位开始不为0
0 匹配错误
1 匹配错误
12 匹配正确
123 匹配正确
1230 匹配错误
0123 匹配错误
120 匹配错误

.:点号表示匹配任意数
[0-9]:表示匹配0到9的数。
[a-z]:表示匹配a到z的小写字母。
[A-Z]:表示匹配A到Z的大写字母。
[^A-Z]:表示匹配非A到Z的其他字符。
[^ABC]:表示匹配非ABC的其他字符。
[a-zA-Z]:表示匹配所有字母。
[0-9\.\-]:表示匹配所有数字,点号,减号
\d:表示匹配0到9的数等价于[0-9]
\D:表示匹配非0到9的数等价于[^0-9]
\w:匹配字母、数字、下划线。等价于[A-Za-z0-9_]
\W:匹配非字母、数字、下划线。等价于[^A-Za-z0-9_]
其他自己理解

NSString *text = @"哈哈哈哈<h1>HELLO WORD IOS 开发</h1>啦啦啦<p>百度一下</p>结束";
NSString *regeStr = @"[a-z0-9A-Z]";
NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:regeStr options:NSRegularExpressionAllowCommentsAndWhitespace error:nil];
NSArray *result = [regex matchesInString:text options:NSMatchingReportCompletion range:NSMakeRange(0, text.length)];

NSMutableString *res = [[NSMutableString alloc]init];
for (NSTextCheckingResult *item in result) {
    NSString *item_text = [text substringWithRange:[item rangeAtIndex:0]];
    if (![item_text isEqualToString:@""]) {
        [res appendString:[NSString stringWithFormat:@"%@ ",item_text]];
    }
}
NSLog(@"%@",res);

[a-z0-9A-Z] 输出所有匹配的结果
// 输出包含大写小写和数字的字符
 h 1 H E L L O W O R D I O S h 1 p p

[a-z0-9A-Z]* 输出所有匹配的结果
// 输出包含大写小写和数字的字符串
h1 HELLO WORD IOS h1 p p

*+ 限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个?就可以实现非贪婪或最小匹配。

比如还是上面的代码,我们改变一下正则表达式:

<.*> 输出所有匹配的结果
// 输出以`<`开头,`>`结尾的字符串,会匹配第一个`<`和最后一个`>`
<h1>HELLO WORD IOS 开发</h1>啦啦啦<p>百度一下</p>

<.*?> 输出所有匹配的结果
// 输出以`<`开头,`>`结尾的字符串,会匹配第一个`<`和前面最近的一个`>`,最后就相当于匹配所有的标签
<h1> </h1> <p> </p>

定位符

^:匹配输入字符串开始的位置(当在[^],方括号中,表示非,排除的意思)
$:匹配输入字符串结束的位置
\b:匹配一个单词边界,即字与空格间的位置。
\B:非单词边界匹配。

不能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置,因此不允许诸如 ^* 之类的表达式。
若要匹配一行文本开始处的文本,请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆。
若要匹配一行文本的结束处的文本,请在正则表达式的结束处使用 $ 字符。
若要在搜索章节标题时使用定位点,下面的正则表达式匹配一个章节标题,该标题只包含两个尾随数字,并且出现在行首

^$:同时使用则表示精准查找:^once$ 表示查找once的单词

text = @"once an cd"
^once 输出结果
查找以once开头的字符串

text = @"Idks dvdw DDmD IDSc"

\\b[a-z0-9A-Z]*\\b 输出所有匹配的结果
// 输出将字母按隔断分开字符串
Idks dvdw DDmD IDSc 

?=?!?<=?<!?: 用于限定它前后的表达式,不能单独使用,本身没有作用。

a(?=b) 匹配后面有 b 的 a。
a(?!b) 匹配后面没有 b 的 a。
(?<=a) b 匹配前面有 a 的 b。
(?<!a) b 匹配前面没有 a 的 b。
industr(?:y|ies) 或运算industry|industries两个中的一个

运算符优先级

优先级由高到低:转义符 > 圆括号和方括号 > 限定符 > 其他 > "或" ,同级则从左到右
转义符: \
圆括号和方括号: (), (?:), (?=), []
限定符: *, +, ?, {n}, {n,}, {n,m}
其他:^, $, \任何元字符、任何字符 定位点和序列(即:位置和顺序)
替换,"或"操作:|

实战

iOS中转义字符可以两个\\,也可\

  • 匹配所有整数:^\\-?[0-9]{1,}$

  • 匹配所有正整数:^[1-9][0-9]{0,}$

  • 匹配所有浮点数:^[-]?[0-9]+(\\.[0-9]+)?$
    但是没有去除前面的0,即-0123.9,-123.9。如果要去掉浮点数前面的0,更换表达式^[-]?([0-9]|[1-9][0-9]+)(\\.[0-9]+)?$

  • 获取所有html标签 <\\/?.+?\\/?><.+?>
    *?表示匹配最近的一个>,即用<>包括里面的字符串

NSString *text = @"哈哈哈哈<h1>HELLO WORD IOS 开发</h1>啦啦啦<p>百度一下</p>结束";
NSString *regeStr = @"<\\/?.+?\\/?>";
NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n"
                                        options:0
                                         error:nil];
text=[regularExpretion stringByReplacingMatchesInString:text options:NSMatchingReportProgress range:NSMakeRange(0, text.length) withTemplate:@""];
// 将所有标签都变成空,这样就得到无标签的字符串。
NSLog(@"%@",text);
  • 获取所有标签,除了a或p的标签:<[^a|p|A|P|>]+>
    同样也是不够严谨,标签之间的空格要去掉。

  • 获取p标签及内容:<\\s*[p|P].*?(<\\s*\\/\\s*[p|P]\\s*>),加上\\s*,同样是为了处理空格的作用。

  • 获取p标签的内容,不包括p标签:(?<=(<[p|P]>))(.*?(?=(</[p|P]>)))
    ?<=的用法,上面有讲过。(?<=(<p>)),意思是获取<p>标签后面的数据(.*?(?=(</p>)))的意思是获取</p>标签前面的数据。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349