首先感谢这两篇博客,代码写的很详细:基于opencv的手写数字识别(MFC,HOG,SVM) - 小菜鸟_yang - 博客园和OpenCV Hog+SVM 学习_秋风细雨的专栏-CSDN博客。数据集在第二个博客中,但是是外网,不方便的话也可以在最后的百度网盘中下载。但是这两篇用的opencv的版本太老旧了,所以自己重新写了一个opencv4.1的,供大家参考。有关HOG的理论参考这篇博客:https://www.learnopencv.com/histogram-of-oriented-gradients/,这个网站是个私人博客网站,个人感觉非常好,内容很多。
首先说一下数据集怎么读入:因为我是在ubuntu上运行opencv,所以没有用批处理,用python将所有图片的路径和标签写入一个txt中。
import os
filter=[".bmp"]
f = open('/Users/shikunming/Desktop/SVM/result.txt', 'a')
res = os.walk("/Users/shikunming/Desktop/SVM/image")
#result = []
for maindir, subdir, file_name_list in res:
for filename in file_name_list:
num = filename.split('_',1)
apath = os.path.join(maindir, filename) # 合并成一个完整路径
ext = os.path.splitext(apath)[1] # 获取文件后缀 [0]获取的是除了文件名以外的内容
if ext in filter:
f.write(apath+'\n')
f.write(num[0]+'\n')
因为图片的标签就包含在图片名中,所以图片的标签就直接用split()分割出来了。
接下来的代码是图片的读取、hog特征计算、svm的训练。
#include <iostream>
#include <opencv2/opencv.hpp>
#include <fstream>
#include <opencv2/ml.hpp>
using namespace std;
using namespace cv;
using namespace cv::ml;
int main(){
vector<string> img_path;//输入文件名变量
vector<int> img_catg;
int nLine = 0;
string buf;
ifstream svm_data( "/root/桌面/SVM/result.txt" );//训练样本图片的路径都写在这个txt文件中,使用bat批处理文件可以得到这个txt文件
unsigned long n;
while( svm_data ) //将训练样本文件依次读取进来
{
if( getline( svm_data, buf ) )
{
nLine ++;
if( nLine % 2 == 0 )//注:奇数行是图片全路径,偶数行是标签 这个if就是把string类型的标签转为整型
{
img_catg.push_back( atoi( buf.c_str() ) );//atoi将字符串转换成整型,标志(0,1,2,...,9),注意这里至少要有两个类别,否则会出错
}
else
{
img_path.push_back( buf );//图像路径
cout<<buf<<endl;
}
}
}
svm_data.close();//关闭文件
vector<Mat> data_mat, res_mat;
for( string::size_type i = 0; i != img_path.size(); i++ )
{
Mat img = imread(img_path[i].c_str());
cout<<"laoding with\t"<<img_path[i]<<endl;
cout<<"...[load done]"<<endl;
if(img.empty())
cout<<"error!!!"<<endl;
HOGDescriptor hog;
hog.winSize = Size(28,28);
hog.blockSize = Size(14,14);
hog.blockStride = Size(7,7);
hog.cellSize = Size(7,7);
hog.nbins = 9;
vector<float> descriptor;
hog.compute(img,descriptor,Size(8,8),Size(0,0));
data_mat.push_back(Mat(descriptor).clone());
cout<<"hog descriptor of this image has done!"<<endl;
}
size_t sample_count = data_mat.size();
cout<<"...[done](sample count:"<<sample_count<<")"<<endl;
Mat trainData;
//convert data_mat to train_data, which the function SVM::train can read.
const int rows = (int)data_mat.size();
const int cols = (int)std::max( data_mat[0].cols, data_mat[0].rows );
Mat tmp( 1, cols, CV_32FC1 ); //< used for transposition if needed
trainData = Mat( rows, cols, CV_32FC1 );
for( size_t i = 0 ; i < data_mat.size(); ++i )
{
CV_Assert( data_mat[i].cols == 1 || data_mat[i].rows == 1 );//检查运行情况 若表达式为false 则返回一个错误信息
if( data_mat[i].cols == 1 )
{
transpose( data_mat[i], tmp );
tmp.copyTo( trainData.row( (int)i ) );
}
else if( data_mat[i].rows == 1 )
{
data_mat[i].copyTo( trainData.row( (int)i ) );
}
}
cout<<"training..."<<endl;
Ptr <SVM> svm = SVM::create();//新建一个SVM
svm->setType(SVM::C_SVC);
svm->setKernel(SVM::RBF);
svm->setDegree(10);
svm->setTermCriteria(TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS,1000,FLT_EPSILON));
svm->train( trainData, ROW_SAMPLE,img_catg );//训练数据
//保存训练好的分类器
svm->save( "/root/桌面/SVM/HOG_SVM_DATA.xml" );
cout<<"HOG_SVM_DATA.xml is saved !!! \n exit program"<<endl;
return 0;
}
至此svm已经训练完成,参数已经保存。我在训练时并没有将所有的图片都参与训练,保留的一部分作为测试数据。我的测试代码如下:
#include <iostream>
#include <opencv2/opencv.hpp>
#include <fstream>
#include <opencv2/ml.hpp>
using namespace std;
using namespace cv;
using namespace cv::ml;
int main(){
Ptr<SVM> classifier = SVM::load("/root/桌面/SVM/HOG_SVM_DATA.xml");
HOGDescriptor *hog = new HOGDescriptor(Size(28,28),Size(14,14),Size(7,7),Size(7,7),9);
Mat test_img = imread("/root/桌面/IMG_3329.jpg");
resize(test_img,test_img,Size(28,28),0,0,INTER_CUBIC);
cvtColor(test_img,test_img,COLOR_BGR2GRAY);
threshold(test_img,test_img,100,255,THRESH_BINARY_INV);
//上面是对待测试数据进行处理
//测试用的图片要与训练用的图片像素个数相同,在这里都是28*28
//imshow("img",test_img);
//waitKey(0);
vector<float> descriptors;
hog->compute(test_img,descriptors,Size(1,1),Size(0,0));
cv::Mat SVMtrainMat = cv::Mat(1, descriptors.size(), CV_32FC1);
int n = 0;
for (vector<float>::iterator iter = descriptors.begin(); iter != descriptors.end(); iter++) {
SVMtrainMat.at<float>(0, n) = *iter;
n++;
}
SVMtrainMat.convertTo(SVMtrainMat, CV_32FC1);
int a = (int)classifier->predict(SVMtrainMat);
cout<<a<<endl;
}
网盘链接:https://pan.baidu.com/s/1eTrC9UybVdvRJYWHlMpmLA 密码:6z48
欢迎留言交流!!