一、概述
苹果对一些常用的正则匹配都作了封装,如时间,时区,网页链接url,电话号码等等,而且这些识别是国际化的,比如中国的手机号是13044345467,XX国的手机号是932-23333222,它都可以识别.又比如中国人的名字是王大明,英国人的名字是 William Jafferson Clinton,也都能识别.
我们不用自己去写正则表达式匹配,而采用NSDataDetector.
阅读它的描述已经能获取大多数信息.
二. 使用方法:
1. 使用NSRegularExpression的方法.
作为NSRegularExpression的子类,它可使用其所有方法.numberOfMatchesInString:options:range就是其一,查看一共有多少匹配项.还有matches(in:options:range:)和firstMatch(in:options:range:)
NSString* string =@"欢迎访问http://www.111cn.net,https://111cn.net\n以及ftp://111cn.net";
NSError* error =nil;
NSDataDetector* detector = [NSDataDetectordataDetectorWithTypes:NSTextCheckingTypePhoneNumber|NSTextCheckingTypeLinkerror:&error];
NSUIntegernumberOfMatches = [detector numberOfMatchesInString:string options:0range:NSMakeRange(0, [string length])];
2. 这是matches(in:options:range:)的用法:
NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSError* error =nil;
NSDataDetector *detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber | NSTextCheckingTypeLink error:&error];
NSArray *matches = [detector matchesInString:string options:0 range:NSMakeRange(0, [string length])];
for (NSTextCheckingResult *match in matches) {
NSRange matchRange = [match range];
if ([match resultType] == NSTextCheckingTypeLink) {
NSURL *url = [match URL];
NSLog(@"url:%@",url);
} else if([match resultType] == NSTextCheckingTypePhoneNumber) {
NSString *phoneNumber = [match phoneNumber];
NSLog(@"phoneNumber:%@",phoneNumber);
}
}
3.块是另一种形式,比较灵活和高效.
为何?因为它是每找到一个match,就进入块一次.
比如一共有4个match,它就会进入4次块.
所以你可以用块的参数stop控制这个块.如果你已经找到需要的match,就设置stop为YES,就不会继续找match了.
NSString * string = @"欢迎访问http://www.jianshu.com/users/72ee5da886ff/latest_articles. 咱的电话是012-1304445928.ps:电话随便写的哟.今天是2016-10-25,天气(weather)不错";
NSError* error =nil;
NSDataDetector *detector = [NSDataDetector dataDetectorWithTypes:NSTextCheckingTypePhoneNumber | NSTextCheckingTypeLink error:&error];
__blockNSUIntegercount =0;
[detectorenumerateMatchesInString:string options:0 range:NSMakeRange(0, [string length]) usingBlock:^(NSTextCheckingResult * _Nullable result, NSMatchingFlags flags, BOOL * _Nonnull stop) {
NSLog(@"flag:%lu",(unsignedlong)flags);
NSRangematchRange = [resultrange];
if ([result resultType] == NSTextCheckingTypeLink) {
NSURL*url = [resultURL];
NSLog(@"url:%@",url);
}
if(count ==0) {
*stop =YES;
}
if ([result resultType] == NSTextCheckingTypePhoneNumber) {
NSString*phoneNumber = [resultphoneNumber];
NSLog(@"phoneNumber%@",phoneNumber);
}
}];
三. 知识点分析
1.options参数
enumerateMatchesInString:range:usingBlock:的options参数官网demo写的是0, 它有个枚举:
NSMatchingReportProgress: 网上说是:找到最长的匹 配字符串后调用block回调.我实验后发现它进入了很多很多次.... so 这个枚举没搞懂
NSMatchingReportCompletion: 当匹配都完成后,还会进入一次block,汇报完成
NSMatchingAnchored: 网上说:从匹配范围的开始出进行极限匹配 .我实验后一次都没进入
NSMatchingWithTransparentBounds: 网上说:允许匹配的范围超出设置的范围. 实验后,正常,有几次匹配就进入几次
NSMatchingWithoutAnchoringBounds: 文档说:禁止^和$自动匹配开始和结束. 实验后,正常,有几次匹配就进入几次
2. NSDataDetector的checkingTypes
上面是比较常用的匹配方式,细心的孩子肯定注意到,NSDataDetector可匹配的枚举还有好多个,是否每个都可用呢?
亲身实验,发现有的不行,运行时程序会报错(no data detector types specified'),说没有这个枚举
NSTextCheckingTypeOrthography : 不可用
NSTextCheckingTypeSpelling : 不可用
NSTextCheckingTypeGrammar : 不可用
NSTextCheckingTypeDate : 可用, 用法有
if([match resultType] ==NSTextCheckingTypeDate) {NSDate*date = [match date];NSLog(@"date:%@", date);NSTimeZone* timezone = [match timeZone];NSLog(@"time zone:%@", timezone);CFTimeIntervalduration = [match duration];NSLog(@"duration:%f", duration);}
NSTextCheckingTypeAddress : 可用, 用法有:
if([match resultType] ==NSTextCheckingTypeAddress) {NSDictionary * addressComponent = [match addressComponents];NSLog(@"城市:%@, 街道:%@", addressComponent[NSTextCheckingCityKey], addressComponent[NSTextCheckingStreetKey]);}
NSTextCheckingTypeLink : 可用 , 用法有:
if([match resultType] ==NSTextCheckingTypeLink) {NSURL*url = [match URL];NSLog(@"url:%@", url);}
NSTextCheckingTypeQuote : 不可用
NSTextCheckingTypeDash : 不可用
NSTextCheckingTypeReplacement : 不可用
NSTextCheckingTypeCorrection : 不可用
NSTextCheckingTypeRegularExpression : 不可用
NSTextCheckingTypePhoneNumber : 可用 ,用法有:
if([match resultType] ==NSTextCheckingTypePhoneNumber) {NSString*phoneNumber = [match phoneNumber];NSLog(@"phoneNumber:%@", phoneNumber);}
NSTextCheckingTypeTransitInformation : 可用
好吧,总结出来就是:NSTextCheckingResult里面有对应的属性,那么这4种匹配就可用:URL,电话,日期,地址
下面是一个大神总结的具体的对应,相信大家一看就明白
奉送验证url方法:
-(BOOL) verifyURL{NSString* string =@"http://www.jianshu.com/users/72ee5da886ff/latest_articles";NSError* error =nil;NSDataDetector* detector = [NSDataDetectordataDetectorWithTypes:NSTextCheckingTypeLinkerror:&error];NSArray * matches = [detector matchesInString:string options:0range:NSMakeRange(0, [string length])];if([matches count] ==1&& matches[0].range.location ==0) {returnYES; }returnNO;}
网上说:
注意:验证URL链接更简单的办法我们还可以借助系统提供的 canOpenURL() 方法来检测一个链接的有效性,比如上面样例可以改成如下的判断方式:
privatefuncverifyUrl(str:String)-> Bool{//创建NSURL实例 iflet url = NSURL(string: str) {//检测应用是否能打开这个NSURL实例 returnUIApplication.sharedApplication().canOpenURL(url) }returnfalse}
官网还告诉我们,解析自然语言用NSDataDetector.
如果文本已经是一种特殊规范了,那么解析它们应该用对应的方式.比如 用DateFormatter来解析 ISO 8601的时间戳.
像机器识别的文本:XML或者json.应该用 XMLParser
或者JSONSerialization来解析它们.
参考链接地址:https://www.jianshu.com/p/bf302b3df743