在我的电脑上是这样的:
我将tesseract安装在了D盘,然后将文件夹路径加入到环境变量里:
然后将要被识别的图片放在某个文件夹下:
在cmd里先切换盘符到图片存放的文件夹路径,然后使用tesseract做识别:
如果用同样的方式去识别中文字符就会失败,因为用默认英文去识别中文字符,很显然不会成功,这时就需要切换语言了:
-l是切换语言的命令,chi_sim是简体中文包,全称是“chi_sim.traineddata”:
识别结果如下:
对于简单的图片,没有线条干扰的,准确率还是挺高的,对于有线条干扰的,有好多背景的识别准确率较低。