测试tesseract和tesserocr是否安装成功

tesseract

桌面下载了一个png格式的名为image的图片,一个名为result的txt文档。

将命令行(cmd)切换到目标文件目录(因为是放在桌面的,文件目录就是desktop),C:\users\海陶\desktop,然后输入命令,tesseract image.png result -l eng && type result.txt(因为是windows,所以是type) 

具体可参看图片。打开result也能看到image中的图像转化成电子文本了。

图2

tesserocr

测试 tesserocr更是费了九牛二虎之力,输入import tesserocr之后,直接提示ImportError: DLL load failed: 找不到指定的模块。

在网上找了半天,才找到一篇语焉不详的文章跟本人的情况差不多,那篇文章提示,下载微软vs2019,安装之后才能解决。

图2

安装成功解决了ImportError: DLL load failed: 找不到指定的模块。

但是新的问题又出现了。输入python3——import tesserocr——from PIL import Image,错误是

ImportError: no modul named pil

网上查到的资料是No module named 'PIL'是因为需要pillow,打开命令行使用pip install Pillow命令

图3

成功了。

图4

于是输入一个完整的python程序。(调用tesserocr下的image_to_text(),路径目录可以有中文)

import tesserocr

from PIL import Image

image = Image.open('C:/users/海陶/desktop/image.png')#注意两点,1是图片路径目录,2是“/”

print(tesserocr.image_to_text(image))

图5

另一种方法,(调用tesserocr下的file_to_text(),路径目录不能有中文)

import tesserocr

print(tesserocr.file_to_text("e:/python/pic/image.png"))

图6

注意:图片在哪个路径目录,一定要写清楚;有些路径可以有中文,有些不能有中文;路径目录一定都是“/”表示。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 第一步安装 Tesserocr的安装爬虫过程中难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们...
    何苦_python_java阅读 12,674评论 0 1
  • 在爬虫过程中,难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们可以直接用OCR来识别。 1. ...
    Einbahn_2018阅读 12,403评论 1 2
  • ¥开启¥ 【iAPP实现进入界面执行逐一显】 〖2017-08-25 15:22:14〗 《//首先开一个线程,因...
    小菜c阅读 11,728评论 0 17
  • 危嘉丽阅读 1,189评论 0 0
  • 重庆的四天,是今年计划之外的行程。赶在加班单失效前匆匆决定出行,庆幸淡季的机票也是白菜价,草草下了单,候机时随便翻...
    大张慧阅读 2,962评论 0 4