OCR样本训练

参考的tesseract-ocr训练方法 - zhanghaihua415的日志 - 网易博客

但是照着弄出现了几个问题

1.在他的第四步步骤的时候

4.Run Tesseract for Training。输入命令:

E:\Tesseract-ocr\tesseract.exe orderNo.tif orderNo nobatch box.train

发现命令错误,需要去掉nobatch就正确了。

2.在他的第六步步骤的时候

6.新建文件“font_properties”。如果是3.01版本,那么需要在目录下新建一个名字为“font_properties”的文件,并且输入文本 :

orderNo 0 0 0 0 0

这个操作过后,执行下一步过后会报错。

网上查找各种方法后,发现改了下命名就可以了。然后从头开始弄了一次就好了,比如图片名,他的是 orderNo.tif 我改成了 xxx.xxx.exp0.tif 这种命名格式过后就可以了。具体照着他的方法命令错误不知道是不是这个原因,本人也不清楚。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容