提起AI,想必大家感觉就是神秘莫测,结合现实。今天看了一下BaiduOCR的技术支持,大概实现了身份证,银行卡,机动车牌,图片审核,这几个案例的识别。不得不说百度对图像的处理还是很强大的。根据开源出来的接口实现对以上功能的开发还是不错的。
废话不多说,既然那么神秘,我们也可以试着自己做一个识别Demo,案例会在最下方提供
1.点击链接BaiduAI
进入控制台登陆自己的百度云账号
2.登陆成功会进入自己的控制台,默认开通的服务如下
我们以文字识别为例,点击文字识别,
可以看到可用服务列表,并不是绝对免费的。但是程序员拿来装X应该没问题
3.创建应用
图中信息很明确,根据自己需要勾选相应的功能,当然部分功能是收费的,具体收费标准点这里
因为程序语言为Object-C 运用于ios上,所以这里我直接勾选如上图,(这里需要注意一点,包名绑定这里,必须要绑定自己创建的工程Bundle Identifier。要不等你一切做好之后发现会提示不匹配工程)确认无误后点击立即创建
创建成功,点击应用详情,进入自己创建的应用查看详情
拿到了自己的APPID,APIKey,SecretKey,记得保存一份,等下项目中要想实现以上功能必须通过这几个东西生成BaiduOCR的Token用,才可以。下边的API列表很详细的告诉我们当前这个项目接入的Api同时收费情况一目了然。很清晰。
4.接入服务
到了这一步,相信你已经成为一名合格的百度OCR的开发者了。下边开始把OCR服务接入我们工程
1.获取百度OCR Access Token
根据官方文档获取Access Token并保存到本地(注意token有效期为30天,过期需要重新获取接口保存token)
static NSString * const BaiduAppID = @"9991413";
static NSString * const BaiduApiKey = @"E2jIt1TZqt1EVYGVdH3L1Tb3";
static NSString * const BaiduSecretKey = @"kIf9V9BktenQCFG8EpmlWChvlTz6GKbl";
static NSString * const BaiduAccess_tokenUrl = @"https://aip.baidubce.com/oauth/2.0/token";
#pragma mark - 获取百度AIAccess Token。有效期为30天
- (void)getBaiduAIAccessToken{
/*
请求URL数据格式
向授权服务地址https://aip.baidubce.com/oauth/2.0/token发送请求(推荐使用POST),并在URL中带上以下参数:
grant_type: 必须参数,固定为client_credentials;
client_id: 必须参数,应用的API Key;
client_secret: 必须参数,应用的Secret Key;
https://aip.baidubce.com/oauth/2.0/token?
grant_type=client_credentials&
client_id=Va5yQRHlA4Fq4eR3LT0vuXV4&
client_secret= 0rDSjzQ20XUj5itV7WRtznPQSzr5pVw2&
*/
// [[AipOcrService shardService] authWithAK:@"sLdWP9rGQ7iu63Pi4hvUP3qw" andSK:@"WF2fWKb8lQ2bfGB5MAAsixIGXCUzWipX"];
NSMutableDictionary * dictionary = [[NSMutableDictionary alloc]init];
[dictionary setObject:@"client_credentials" forKey:@"grant_type"];
[dictionary setObject:BaiduApiKey forKey:@"client_id"];
[dictionary setObject:BaiduSecretKey forKey:@"client_secret"];
[NetWorkTool postNetWorkWithURL:BaiduAccess_tokenUrl paramaters:dictionary success:^(id object) {
NSLog(@"%@",object);
NSString * access_token = [object objectForKey:@"access_token"];
NSString * expiresHaveTime = [NSString stringWithFormat:@"%@",[object objectForKey:@"expires_in"]];
[[NSUserDefaults standardUserDefaults] setObject:access_token forKey:AccessTokenKey];
[[NSUserDefaults standardUserDefaults] setObject:expiresHaveTime forKey:TokenValidity];
[[NSUserDefaults standardUserDefaults] synchronize];
NSInteger validityTime = [expiresHaveTime integerValue];
if (validityTime <=0 || !validityTime) {
UIAlertController * alertC = [UIAlertController alertControllerWithTitle:@"Warring" message:@"您使用的百度AI识别功能Access_Token已失效,请重新获取" preferredStyle:UIAlertControllerStyleActionSheet];
UIAlertAction * confirmAction = [UIAlertAction actionWithTitle:@"确定" style:UIAlertActionStyleDefault handler:^(UIAlertAction * _Nonnull action) {
[self.window.rootViewController dismissViewControllerAnimated:YES completion:^{
}];
}];
[alertC addAction:confirmAction];
[self.window.rootViewController presentViewController:alertC animated:YES completion:nil];
}
} failure:^(id failure) {
NSLog(@"%@",failure);
}];
}
这里请求数据用到了自己对AFNetworking的简单封装,有兴趣可以到文章最后Demo地址进行查看
获取Access Token 成功的话,我们可以根据AI开放平台中的文字识别API技术文档来搞事情了。
以身份证识别为例
从官方给出的API文档可以看出,通过POST方法向BaiduAI服务器发起请求,重点是链接中必须携带刚才获取的Access Token,由此可以看出我们在百度AI平台创建应用的重要性了。。。
头部需携带一下参数
Content-Type application/x-www-form-urlencoded
重要的是Body中带的参数,
可以看出 image是必须携带的,并且要求还很多
图像数据,base64编码,要求base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/png/bmp格式
要求一大串,不过没办法。想要获取到数据,还是要老老实实跟着文档走。这个提出一个坑。卡了三天没找到原因(其实我也没那么笨啊)
base64编码,对于这个东西,真没细心理解过。百度给出以下定义
/*
NSDataBase64Encoding64CharacterLineLength其作用是将生成的Base64字符串按照64个字符长度进行等分换行
NSDataBase64Encoding76CharacterLineLength其作用是将生成的Base64字符串按照76个字符长度进行等分换行
NSDataBase64EncodingEndLineWithCarriageReturn其作用是将生成的Base64字符串以回车结束
NSDataBase64EncodingEndLineWithLineFeed其作用是将生成的Base64字符串以换行结束。
*/
亲测只有使用了NSDataBase64EncodingEndLineWithCarriageReturn这个枚举的时候,图片识别才不会报图片格式错误。具体原因不详。有知道的麻烦不辞辛苦告知下
请求代码示例
身份证识别
curl -i -k 'https://aip.baidubce.com/rest/2.0/ocr/v1/idcard?access_token=24.f2c915b857ee62189abb7f92df0e8453.2592000.1499493935.282335-9395294' --data 'id_card_side=front&image=【图片Base64编码,需UrlEncode】' -H 'Content-Type:application/x-www-form-urlencoded'
到这里,其实基本功能已经实现。我们正常的通过拍照,或者相册中获取过来的图片,就可以识别出来了。