windows安装tesseract-ocr

一、安装步骤

  1. 双击tesseract-ocr-w64-setup-5.3.4.20240503.exe 安装包,点击ok

  2. 点击【Next】


  3. 点击【I Agree】


  4. 点击【Next】


  5. 选择安装组件


  • 展开【Additional language data】
  • 勾选 【Math / equation detection module】和 【Chinese(Simplified)】
  • 点击 【Next】
  1. 选择安装路径


  2. 点击【Install】


  3. 点击【Next】


    image.png
  4. 点击【Finish】


  5. 新建系统变量,变量名为:TESSERACT_HOME,变量值为刚刚选择的安装路径

    image.png

  6. 编辑环境变量(Path),新建,并填写:%TESSRACT_HOME%

安装完成

在一张待识别图片的目录下,打开command窗口,执行:

tesseract 七镜主页.jpg 图像转文字结果 -l chi_sim
  • tesseract:工具名
  • 七镜主页.jpg:图像名
  • 图像转文字结果:指定输出转换结果的的txt文件名
  • -l chi_sim:指定识别语言为简体中文
  • 打开图像转文字结果.txt 可以看到识别结果,不是特别完美,不过基本上够用了,毕竟一般还要做二次加工的。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容