图片识别

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
# pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
# image = Image.open("C:/Program Files (x86)/Tesseract-OCR/doc/phototest.tif")
image = Image.open("oo.png") #路径
tessdata_dir_config = '--tessdata-dir "C:/Program Files (x86)/Tesseract-OCR/tessdata"'  #在.py文件配置中指定tessdata-dir
text=pytesseract.image_to_string(image,config=tessdata_dir_config)
print(text)

出现问题解决原因:

1.将# pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'的注释去掉

  1. 下载Tesseract-OCR安装包,记录好路径,将路径粘贴进去。
    3.下载中文简体字识别包:https://raw.githubusercontent.com/tesseract-ocr/tessdata/4.00/chi_sim.traineddata
    放在Tesseract-OCR/tessdata/的文件夹下面。
    繁体字识别包:https://github.com/tesseract-ocr/tessdata/raw/4.0/chi_tra.traineddata
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容