OCR - 行驶证识别(SVM训练及判断篇二)

声明 本文暂时禁止任何形式的转载, 以下示例图片为了不侵犯个人行驶证隐私,全部做打码处理。


前言

人工智能这个课题研究的主要目的就是实现“机器人” *模拟人的能力 人最强大的地方在于大脑,可以不断的学习积累经验,继而创新。机器识别图像的过程,说白了就是在模拟人类识别的过程。在上一章做到了机器读入图片(模拟人类通过眼睛看到从三维空间到视觉上二维成像)我们接下来让机器模拟人类记忆->积累经验-> 下次看到-> 识别出的一个过程

基础

我们判断一个物体是 太阳?月亮? 是如何判别呢。是小时候我们还在上幼儿园时,老师指着 🌞 = 太阳 🌛 = 月亮 也就是图像+标签方式。机器就是小时候的我们,他不知道,他需要我们作为老师教授。SVM 支持向量机就是这个原理。我们把认识的过程叫训练,人类会把这个训练记在脑海里形成记忆片段,而机器会生成的叫训练模型。
我们在上一章最后生成了想要的图片,如下


image.png

那根据红框区域截取图片,我们把想要特征的图片叫Positive,不想要的特征图片叫Negative,依次会有以下图片

Negative

image.png
image.png
image.png
image.png
image.png
image.png

Positive

image.png

我们把Positive的图片告诉机器去记住,有这个特征的就是行驶证。把Negative的图片告诉机器去记住,有这些特征的就不是行驶证。这样,当这两类数据足够多时,能包容更多场景时,机器的识别率就会显著提高。这里要实现机器识别一个很重要的方法就是SVM中文翻译是支持向量机学习。 这名字听起来就高大上有没有。
在我的工程目录下创建一个SVM包,包的结构如下

image.png

Model目录 存在一个名称为svm.xml的文件这就是训练之后得到的模型(对比人类就是记忆片段),因为该模型的作用是判断图片是行驶证因此我们取名字叫“行驶证判断模型”
test目录train目录, 先说train目录就是字面意义“训练”,教给机器去告诉他去记住具有Positive特征的图片就是行驶证,具有negative特征的不是行驶证,用计算机表示就是1和0. 因此代码上就是这样做的,看代码:

   void train() {
        //初始化,参数调试很重要,会影响识别率
        svm_ = cv::ml::SVM::create();
        svm_->setType(cv::ml::SVM::C_SVC);
        svm_->setKernel(cv::ml::SVM::RBF);
        svm_->setDegree(0.1);
        svm_->setGamma(0.1);
        svm_->setCoef0(0.1);
        svm_->setC(1);
        svm_->setNu(0.1);
        svm_->setP(0.1);
        svm_->setTermCriteria(cvTermCriteria(CV_TERMCRIT_ITER, 20000, 0.0001));

        //获得训练数据
        cv::Ptr<cv::ml::TrainData> train_data = tdata();

        //训练
        svm_->train(train_data);

        //训练后的数据(记忆片段) 保存在指定文件里
        string svm_xml_ = "/Users/xiu/Documents/Company/workspace/ocr/ocr/resource/model/svm.xml";
        svm_->save(svm_xml_);
    }

看代码注释部分应该都会懂了。这就是一个训练的完整过程。具体再看下获得训练数据,这一个代码片段也是非常重要,说明一点c++工程我实现了SVM,但是官方封装的Java接口,通过JNI方式去实现 SVM 始终会报错,我的底层opencv是3.2版本的,如果Java工程可以实现请联系我,我哪天抽空调通了也会单独发文。
获得训练数据代码片段:

 cv::Ptr<cv::ml::TrainData> tdata() {
        cv::Mat samples;
        std::vector<int> responses;
        //指定Negative和Positive数据所在目录
        string has_file_path_ = "/Users/xiu/Documents/Company/workspace/ocr/ocr/resource/src/train/positive";
        string no_file_path_ = "/Users/xiu/Documents/Company/workspace/ocr/ocr/resource/src/train/negative";
        std::vector<string> has_file_list_ = VLUtil::getFiles(has_file_path_, true);
        std::vector<string> no_file_list_ = VLUtil::getFiles(no_file_path_, true);

        for (string f : has_file_list_) {//是行驶证
            auto image = cv::imread(f);
            if (!image.data) {
                continue;
            }
            cv::Mat feature;
            VLUtil::getLBPFeatures(image, feature);//提取特征,经过试验彩色图片识别率并不好
            feature = feature.reshape(1, 1);
            samples.push_back(feature);
            responses.push_back(int(1));// 是标记为1
        }

        for (string f : no_file_list_) {//非行驶证
            auto image = cv::imread(f);
            if (!image.data) {
                continue;
            }
            cv::Mat feature;
            VLUtil::getLBPFeatures(image, feature);
            feature = feature.reshape(1, 1);
            samples.push_back(feature);
            responses.push_back(int(0));//非,标记为0
        }

        //生成TrainData
        cv::Mat samples_, responses_;
        samples.convertTo(samples_, CV_32FC1);
        cv::Mat(responses).copyTo(responses_);
        return cv::ml::TrainData::create(samples_, cv::ml::SampleTypes::ROW_SAMPLE,
                                         responses_);
    }

代码意义还是看下注释就OK了
肯定有人在问了test目录是什么。是这样的,我们训练出了模型,如果判断该模型是好是坏呢。当然是拿测试数据来判断了。原始数据为100的话,测试和训练数据最好占比是 30% 和70% ,理论上训练数据越多,识别率越高。没有原始数据来源,几乎没法去做图像识别,样本数据是重中之重。有的人在开始做时,拿100%的原始数据去做训练,然后用原始数据去测试,这样是不对的。举个例子,老师平常教授的知识,作为例子讲解的题目。如果拿到考试当中,就无法去真正辨别学生该知识的真实情况。SVM也是同样道理。
我们接下里拿训练模型去判断未知图片是否为行驶证。代码片段:

     * 判断这些矩形是否含有行驶证,其中有一个是,就是
     */
    bool predict(const std::vector<string> &path) {
        bool isVehicleLicenseOCR = false;
//        svm_ = cv::ml::SVM::load(svm_xml_);

        for (string f : path) {
            auto image = cv::imread(f);
            if (!image.data) {

                std::cout << "error : file not exist" << f << std::endl;
                continue;
            }
            cv::Mat feature;
            VLUtil::getLBPFeatures(image, feature);
            int predict = int(svm_->predict(feature));
            std::cout << "file name :" << f << "   predict: " << predict << std::endl;
            if(predict>=1){
                isVehicleLicenseOCR = true;
            }

        }

        return isVehicleLicenseOCR;
    }

该过程就是通过第一篇处理后的图片,得到若干矩形,具有行驶证特征的图片则返回1,只要有一个大于1的图片就是行驶证。说明其图片就是行驶证。

结束语

通过SVM训练,目前我的样本库Positive有300张,Negative有500张,现在的行驶证识别率能达到95%以上,不过还需要更多训练更多种场景的样本。后续第三章,我们回归图像处理,为第四章的ANN行驶证识别其中的文字来做铺垫。 关于文字识别开始我走了一段弯路,后来没有做下去,我想单独拿一张来分享。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容