tess4j解析数字验证码

网上看到了验证码破解,除了像12306越升级越变态的验证码很难破解外,其他比如数字、字母、干扰线之类的还是可以轻松破解的
比如tess4j这个工具
具体资料可以查看http://tess4j.sourceforge.net/usage.html
网上给的案例都好简单,但是运行在我的Mac上老是报错:Unable to load library 'tesseract': Native library (darwin/libtesseract.dylib。。。。
其实,是因为在Mac上需要安装tesseract,解决办法查看官方wiki

https://github.com/tesseract-ocr/tesseract/wiki

可以使用brew安装

brew install tesseract

安装成功后,就可以写代码了
新建maven工程
pom.xml中导入testng、tess4j、jna

<dependencies>

    <!-- https://mvnrepository.com/artifact/org.testng/testng -->
    <dependency>
        <groupId>org.testng</groupId>
        <artifactId>testng</artifactId>
        <version>6.11</version>
        <scope>test</scope>
    </dependency>
    <!-- https://mvnrepository.com/artifact/net.sourceforge.tess4j/tess4j -->
    <dependency>
        <groupId>net.sourceforge.tess4j</groupId>
        <artifactId>tess4j</artifactId>
        <version>3.4.0</version>
    </dependency>
    <!-- https://mvnrepository.com/artifact/net.java.dev.jna/jna -->
    <dependency>
        <groupId>net.java.dev.jna</groupId>
        <artifactId>jna</artifactId>
        <version>4.4.0</version>
    </dependency>

</dependencies>

下载一张数字验证码的图片,导入到工程file文件夹下(file文件夹是新建的)
到github上下载tessdata,放到工程目录下

https://github.com/tesseract-ocr/tesseract/tree/master/tessdata

在以下地址中下载语言包,放到工程目录中的tessdata下(比如eng.traineddata)

https://github.com/tesseract-ocr/tessdata
image.png

新建一个类

public class TestCode {
    @Test
    public void testCode(){
        File imageFile=new File("./file/captcha-image.jpeg");
        ITesseract tesseract=new Tesseract();
        try {
            String result=tesseract.doOCR(imageFile);
            System.out.println(result);

        } catch (TesseractException e) {
            e.printStackTrace();
        }
    }
}

运行成功,结果很完美

image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,967评论 25 709
  • 1、简介 ​ a、Python-tesseract 是一个基于 google's Tesseract-OCR ...
    慢慢慢慢热阅读 12,104评论 1 5
  • 一到周五的晚上,大约从七点开始,一阵阵笑声穿透楼板,传至耳畔。楼上住着一群年轻人,是一家公司的集体宿舍。周五,大概...
    柳二白阅读 3,146评论 0 1
  • 雨断断续续下了一天,今天不是太忙,上午“苹果”来了,相比上次来时的沉默,这次“苹果”又复活了,拿着那个吹泡泡...
    杏林园中一颗草阅读 1,553评论 0 1
  • 本文参加#未完待续,就要表白#活动,本人承诺,文章内容为原创,且未在其他平台发表过。 清晨,坐在荟萃广场,看着跳...
    我是二村阅读 1,833评论 0 2