转自:http://blog.csdn.net/u012236875/article/details/74726035
使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别。
下载baidu-aip这个库,可以直接使用pip下载:pip install baidu-aip,也可以在PyCharm等开发工具中下载。
然后运行下列代码即可。
# -*- coding: UTF-8 -*-
from aip import AipOcr
import json
# 定义常量
APP_ID ='9851066'
API_KEY ='LUGBatgyRGoerR9FZbV4SQYk'
SECRET_KEY ='fB2MNz1c2UHLTximFlC4laXPg7CVfyjV'
# 初始化AipFace对象
aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)
# 读取图片
filePath ="WechatIMG1.jpeg"
def get_file_content(filePath):
with open(filePath,'rb') as fp:
return fp.read()
# 定义参数变量
options = {
'detect_direction': 'true',
'language_type': 'CHN_ENG',
}
# 调用通用文字识别接口
result = aipOcr.basicGeneral(get_file_content(filePath), options)
print(json.dumps(result).decode("unicode-escape"))
输出结果:
{"log_id": 1424393327, "direction": 0, "words_result_num": 2, "words_result": [{"words": "不就果钱么!"}, {"words": "所技"}]}
我的这次识别有几个错误,与图片不清晰有关,下面是我识别的图片。
通用文字识别 返回数据参数详情
字段必选类型说明
direction否number图像方向,当detect_direction=true时存在。
- -1:未定义,
- 0:正向,
- 1: 逆时针90度,
- 2:逆时针180度,
- 3:逆时针270度
log_id是number唯一的log id,用于问题定位
words_result_num是number识别结果数,表示words_result的元素个数
words_result是array定位和识别结果数组
+words否string识别结果字符串