Tesseract Ocr文字识别
环境 windows10 + python 3.6 + tesseract 4.0.0-beta.1
pip install pytesseract
安装tesseract orc
下载地址:https://github.com/UB-Mannheim/tesseract/wiki 点击“tesseract-ocr-w64-setup-v4.0.0-beta.1.20180414.exe”下载安装。
将tesseract.exe 加入环境变量
测试代码
from PIL import Image
import pytesseract
path = "img\\text-img.png"
text = pytesseract.image_to_string(Image.open(path), lang='chi_sim')
print(text)