Python下的OCR识别

//简单的东西玩了一天...很尴尬

0.工具

PIL py的图片处理库
pytesseract
tesseract-ocr
下载地址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe
安装完成后要把路径写入Path
like this:

写入Path

1.代码

try:
    import Image
except ImportError:
    from PIL import Image
import pytesseract

image = Image.open('./pic/c_e_test.jpg')
code = pytesseract.image_to_string(image)
print('\n\n\n'+code)

2.图片要求
纯英文的,因为默认语言包是识别英文语言包.同时英文的识别率基本上100%.

更换中文语言包

下载地址
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#special-data-files
下载完成后找到以下目录替换原文件

image.png

3.其他
这次遇到了一个大坑关于权限问题
由于我用SSD没分区全部文件在C盘导致有些需要管理员权限的无法调用
这个时候只能用管理员DOS手动运行程序

so.装系统要分区！！！！

最后编辑于：2017.12.10 03:21:07

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文

Python下的OCR识别

相关阅读更多精彩内容

友情链接更多精彩内容