2019-07-11 ActionScript3.0使用百度智能API OCR识别图片中文字

昨天开始使用百度的API来整合到图片提取工具中,
百度OCR通用版本的识别免费次数有50000次/天,应该满足需求。

因为没有现有的AS3代码实现,所以参考网上JAVA代码实现
API地址:
https://cloud.baidu.com/doc/OCR/OCR-API/24.5C.E8.BF.94.E5.9B.9E.E8.AF.B4.E6.98.8E.html
https://cloud.baidu.com/doc/OCR/s/zjwvxzrw8/

先用百度帐号登录百度智能,点击“管理控制台”进到后台管理页。
选择产品 ===>文字识别
创建一个应用,就可以获得appid/appKey/serectKey.调用的时候需要用这三个值去获得token

调用的逻辑
1,程序打开的时候,先获取access_token.

/**百度文字识别(高精度版)的路径**/
public static var ocr_url_1:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/accurate_basic";     
/**百度文字识别(通用版)的路径**/
public static var ocr_url_2:String = "https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic";      
/**百度签权URL,获取TOKEN**/
public static var ocr_token_url:String = "https://aip.baidubce.com/oauth/2.0/token";
public function startCheckApp():void
        {
            var req:URLRequest = new URLRequest();
            req.url = OCRBaiduDefault.ocr_token_url;
            req.method = URLRequestMethod.POST;
            var val:String = "grant_type=client_credentials&client_id={1}&client_secret={2}";//参数说明自行查看官方文档
            val = val.replace("{1}",OCRBaiduDefault.ocr_apiKey).replace("{2}",OCRBaiduDefault.ocr_screctKey);
            req.data = new URLVariables(val);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequsetToken);
            loader.load(req);       
        }
        
        
        private function onRequsetToken(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错:"+str);
            }
            else
            {
                var token:String = res.access_token;
                var time:* = res.expires_in;
                OCRBaiduDefault.ocr_access_token = token;//获取到的token值保存在静态变量里
            }
        }

2,把本地的图片加载,获得二进制数组.这一段是基础的加载ByteArray

private function onClick(e:*):void
{
    var url:String = "G:/Aproj6Haiwai/taiwan_ws/client/proj/bin/h5/res/art/artifact2/lz_lingzhen_hose_01.png";
    var loader:URLLoader = new URLLoader();
    loader.dataFormat = URLLoaderDataFormat.BINARY;
    loader.addEventListener(Event.COMPLETE,onLoaded);
    loader.load(new URLRequest(url));
}
private function onLoaded(e:Event):void
{
    var bytes:ByteArray = e.target.data;
    OCRReqManager.getIns().startOCRrequest(bytes);
}

3,把二进制数组进行编码Base64,再用encodeURI编码
4,把token当成url参数,请求头Content_Type 设置为application/x-www-form-urlencoded。

public function startOCRrequest(bytes:ByteArray):void
        {
            var req:URLRequest = new URLRequest();
                        var base64:String = Base64.encodeByteArray(bytes);  
            baseStr = baseStr.replace("\n","");
            var variables:URLVariables = new URLVariables();
            variables.image = baseStr;
            req.data = variables;
            //开始用这种写法,
            //一直报216201 image format error.也不知道为啥
            //base64 = encodeURI(base64);
            //var val:String = "image={1}";
            //val = val.replace("{1}",base64);
            //req.data = new URLVariables(val);                 
            
            //https://aip.baidubce.com/rest/2.0/ocr/v1/general?access_token="前面获取的token值"
            req.url = OCRBaiduDefault.ocr_url_2 + "?access_token="+OCRBaiduDefault.ocr_access_token;
            req.method = URLRequestMethod.POST;         
            var header:URLRequestHeader = new URLRequestHeader("Content-Type","application/x-www-form-urlencoded");
            req.requestHeaders.push(header);
            
            var loader:URLLoader = new URLLoader();
            loader.addEventListener(Event.COMPLETE,onRequestBack);
            loader.load(req);       
        }
        
        private function onRequestBack(e:Event):void
        {
            var str:String = e.target.data;
            var res:Object = JSON.parse(str);
            if(res.hasOwnProperty("error_code"))
            {
                trace("报错:"+str);
            }
            else
            {
                var backVo:OCRBaiduVo = OCRBaiduVo.encodeJSON(str);
            }
        }

返回值

{"log_id": 7247048436949274572, "words_result_num": 3, "words_result": [
  {"words": "角色连击酷炫外观"}, {"words": "等你来寻宝!"}, {"words": "小手一抖,葫芦到手"}
]}

这里踩了个坑,就是开始用variables.encode(str)这种方法,把base64码传进的时候,报错,虽然网页的Network记录看起来发送是一样的。这里卡住我挺久的。

知识点

1.一般网络请求,提交图片文件都用Base64格式,通过post的参数

另外

尝试了google tesseract OCR 工具
安装和环境变量配置:
https://blog.csdn.net/qq_40147863/article/details/82285920
教程上说自己下载语言包,实际在安装时选中要安装的语言包就可以了
下载了最新版本5.0.0,项目中的图片因为不是正楷字,辨识太差了,所以不考虑。
如果今后用到辨识端正的字体或数字,应该还是可以用的

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容