Java使用test4j识别验证码

Java使用test4j识别验证码

test4j的集成

  • 此处使用了拷入test4j的项目文件集成到自己的项目中去。

1.去test4j官网下载test4j的zip文件(我下载的是3.4.8的版本);

2.解压缩文件,得到以下目录


需要拷贝到项目中的文件.png

3.把lib里面的jar包加入项目中,scr下的代码文件copy到项目中,tessdata文件copy到项目中(跟src同级目录)。(tessdata就是训练文件,英文识别较为准确,中文识别准确率一般)
4.dist 目录下的test4j-3.4.8.jar文件添加到项目中;
5.识别验证码

import java.io.File;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;

public class Test {
    public static void main(String[] args) {
        System.out.println("HelloWord");
        // 1.创建 ITesseract 验证码识别类
        ITesseract instance = new Tesseract();
        // 2.创建文件
        File newFile = new File("my//我是1.jpg");
        // 3.开始识别
        try {
            String codeString = instance.doOCR(newFile);
            System.out.println("识别内容是:" + codeString);
        } catch (TesseractException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
    }
}
  1. 关于错误:Exception in thread "main" java.lang.UnsatisfiedLinkError: Unable to load library 'libtesseract304': Native library (win32-x86-64/libtesseract304.dll) not found in resource path;
    只要是按照我这个方法来集成一般不会出现这种问题,出现这种问题有可能是因为test4j的jar文件导致的,一定要去官网下载,尽可能不去copy别人项目中的;
  • 解决方法:你在官网下载的zip文件lib目录中有一个(win32-x86-64)的文件夹,把他拷贝到项目的bin目录下就行了;
  • 注意不同版本的(win32-x86-64)文件下的那个文件名可能不一致;(版本有差异)
    例如:
    test4j 3.4.8版本下(lib/win32-x86-64)文件夹下的名字是:libtesseract3051.dll
    test4j 3.1版本下(lib/win32-x86-64)文件夹下的名字是:libtesseract304.dll

7.test4j 不识别问题,图片的格式改成 jpg,


带背景验证码.jpg
简单验证码.png

能识别带背景的验证码,却不能识别只有几个噪点的验证码,我用ps改成jpg格式的立马就识别出来了

验证码的预处理

  • 虽然test4j可以识别一些简单验证码,对于复杂的识别率还是不高,为了提高识别成功率,识别前,对图片进行处理,例如去除噪点,去除背景线等;
  • 我这边只需要实现识别简单验证码的功能,所以我的这个预处理不一定适合你。
  • 上面简单验证码的特点分析:验证码数字是红色不会变,背景纯白色,有一些零散的噪点,噪点的颜色不确定,彩色噪点;
  • 实现思路:遍历每一个像素点,判断是不是红色Rgb(255,0,0)的(说明是验证码的颜色),转化为黑色,其他颜色转化为白色,这样识别成功率大大提高,得到的验证码如下:


    改变颜色之后的验证码.jpg
/**
     * 去除噪点
     * 
     * @param img 需要去除噪点的文件
     */
    private static void getAuthCode() {
        BufferedImage img = ImageIO.read(new File("my//" + fileName));
        // 获取图片的高宽
        int width = img.getWidth();
        int height = img.getHeight();

        for (int x = 0; x < width; x++) {
            for (int y = 0; y < height; y++) {
                Color color = new Color(img.getRGB(x, y));
                // System.out.println("我是颜色:::" + color + "我是位置x:" + x + ",y=" + y);

                // 判断色值是不等于白色,不等于白色进行下一步判断(其他颜色)
                if (color.getRGB() != Color.WHITE.getRGB()) {

                    // 判断颜色是否等于红色,(红色就是验证码的颜色)
                    if (color.getRGB() == Color.RED.getRGB()) {
                        // 等于红色设置为黑色
                        img.setRGB(x, y, Color.BLACK.getRGB());
                    } else {
                        // img.setRGB(x, y, Color.white.getRGB());
                        // 不等于红色,设置为白色
                        img.setRGB(x, y, Color.WHITE.getRGB());
                    }
                } else {
                    // 是白色,继续设置为白色
                    img.setRGB(x, y, Color.WHITE.getRGB());
                    // System.out.println("else执行了吗");
                }
            }
        }

    }
//图片转化格式
BufferedImage img;
            try {
                img = ImageIO.read(new File("png图片地址xx.png"));

                if (!newFile.exists()) {
                    File dir = newFile.getParentFile();
                    if (!dir.exists()) {
                        dir.mkdirs();
                    }
                    newFile.createNewFile();
                        //保存为jpg格式
                    ImageIO.write(img, "jpg", newFile);
                }
            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
  • 欢迎留言沟通交流,下一篇准备写去除噪点的文章。
  • End
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容