用Python识别图像里的文字

看上锁的PDF文档或者是图片的时候,如果有数量较多的文字信息想要复制过来,一般都会用到OCR软件。这次我想介绍一个如何用Python来实现读取图片文字的功能。


首先介绍一下这次主要会用到的工具,那就是百度智能云里面的通用文字识别。


首页→产品→精选推荐→通用文字识别


先看文档再使用

先查看一下技术文档,看一下需要的参数,使用方法以及输出结果的格式


参数(大部分非必选)


然后在左边找到Python,点击快速入门


首先需要安装baidu-aip,然后导入


这里面提到的三个常量需要回到上面的“立即使用”那里获取。(已登录百度账号的情况下)点击立即使用,会看到如下界面

首次注册的话是没有应用的,这个时候就需要去创建一个。



这里正常填写就ok了。虽然有使用的次数限制,但是只要有账号他的文字识别功能我们都是可以免费使用的。

创建完之后再点进管理应用,我们就能看到那三个常量了。


接下来展示一下实际使用效果。


测试用图片

在前面的技术文档那里我们已经知道他返回的数据格式了,所以我们可以直接提取并分好行。

以上就是我用Python通过借用百度的ai来实现图像文字识别的过程了。掌握了之后真的是非常简单,毕竟只是使用的话并不需要自己去解析baidu-aip的具体内容。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。