登录注册写文章

调用tesseract_ocr实现OCR（一）

调用tesseract_ocr实现OCR（一）

摘要

本文档记录了本人如何使用tesseract_ocr实现字符识别功能。该技术文档包括函数解释与工程实例，如需转载，请注明引用。

如何提高识别率

外部处理
- 根据官方技术文档可知,tesseract本身对输入图像会使用一些图像处理并分割字符，但有时效果不佳可以通过以下方法提高。
  - 尺度化
    首先，保证图片大小最好在200X200以上，或者说单个字符至少是30像素X30像素以上（下限是多少我也不知道）。过小识别率会降低。
    其次，适当拉宽图像，以OpenCV为例，使用resize(src, dst, Size(0,0), 1.2, 1.0, INTER_LINEAR);输出图像的width是输入图像的1.2倍，height不变。
  - 二值化
    虽然不二值化tesseract也能识别，但识别的准确率不稳定，因此强烈建议使用二值化操作，增强字符与背景的对比度。
    
    testing_result1.JPG
  - 去噪
    二值化后图片可能会留下许多噪点，因此去噪是十分有必要的，否则会同样会导致识别错误。
    
    捕获.JPG
    
    统计学、形态学去噪都有不错的效果，具体情况具体分析。
  - 旋转校正与去边缘
    tesseract基本不支持旋转变换，因此自行修正旋转。同时边缘结构同样会影响识别。
    总而言之，输入tesseract的图像最好是背景没有噪点、字符工整的。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

使用Tesseract训练lang文件并OCR识别集装箱号
在某产品的规划中，想要通过监控视频进行 “集装箱计数” 与 “集装箱号” 识别，以便与舱单数据进行自动化的对比，发...
lonelygo阅读 27,752评论 20赞 19
iApp_《ijs》速成开发手册3.0
《ijs》速成开发手册3.0 官方用户交流：iApp开发交流（1） 239547050iApp开发交流（2） 10...
叶染柒丶阅读 5,646评论 0赞 7

iApp_《裕语言》速成开发手册3.0
《裕语言》速成开发手册3.0 官方用户交流：iApp开发交流（1） 239547050iApp开发交流（2） 10...
叶染柒丶阅读 28,766评论 5赞 20
iApp_《ilua》速成开发手册3.0
《ilua》速成开发手册3.0 官方用户交流：iApp开发交流（1） 239547050iApp开发交流（2） 1...
叶染柒丶阅读 11,519评论 0赞 11
1月3日日课感悟：罗伯特议事规则
当你在让别人做决定的时候，不要盯着别人看。要尊重别人的看法，每一个决定都是一个思考的过程。就像我们的打分，只有自己...
王榕榕阅读 103评论 0赞 0

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文