看上锁的PDF文档或者是图片的时候,如果有数量较多的文字信息想要复制过来,一般都会用到OCR软件。这次我想介绍一个如何用Python来实现读取图片文字的功能。
首先介绍一下这次主要会用到的工具,那就是百度智能云里面的通用文字识别。

首页→产品→精选推荐→通用文字识别

先看文档再使用
先查看一下技术文档,看一下需要的参数,使用方法以及输出结果的格式

参数(大部分非必选)

然后在左边找到Python,点击快速入门

首先需要安装baidu-aip,然后导入

这里面提到的三个常量需要回到上面的“立即使用”那里获取。(已登录百度账号的情况下)点击立即使用,会看到如下界面

首次注册的话是没有应用的,这个时候就需要去创建一个。


这里正常填写就ok了。虽然有使用的次数限制,但是只要有账号他的文字识别功能我们都是可以免费使用的。
创建完之后再点进管理应用,我们就能看到那三个常量了。

接下来展示一下实际使用效果。

测试用图片
在前面的技术文档那里我们已经知道他返回的数据格式了,所以我们可以直接提取并分好行。

以上就是我用Python通过借用百度的ai来实现图像文字识别的过程了。掌握了之后真的是非常简单,毕竟只是使用的话并不需要自己去解析baidu-aip的具体内容。