环境配置:
ubuntu:Ubuntu 16.04.5 LTS x86_64
tensorflow:1.5.0
cv2:3.4.4
基于tensorflow利用卷积神经网络训练自己的图像样本数据具体步骤如下:
1.获取样本文件
2.产生用于训练的批次
3.定义训练的模型(包括初始化参数,卷积、池化层等参数、网络)
4.训练
5.验证
1.读取图片文件
图1是我的部分图片样本数据的名称。图片来源是通过opencv截取的人脸照片,‘-’前部分为测试人脸名称。大小为(60*60*3)高-宽-颜色通道。由于图片命名与训练标签有关。
获取文件名及对应的标签,由于标签是one-hot类型,根据文件名的“-”前半部分为人的名称。本想通过直接将名称的各个字符相加之和作为标签,但是考虑到如果名称太长,那么和就非常大,不适合使用one-hot作为标签矩阵了。于是改成{文件名前部分:label}的json格式,来实现标签与名称的映射关系,待预测时,根据标签找到对应的名称即可。
下图功能是获取filename目录下的文件名与文件名对应的标签.(还可以加个判断对应的文件是否已jpg结束)
将jsonData文件名对应的索引作为标签,即类别(其数据类型要确定,后面要转为tensor类型数据)。image_list为图片文件的绝对路径名称。
2.产生训练批次
根据对应的文件名读取内容,将其放在文件队列中。进行批量获取。
首先使用tf.cast转化为tensorflow数据格式,使用tf.train.slice_input_producer实现一个输入的队列。label不需要处理,image存储的是路径,需要读取为图片,接下来的几步就是读取路径转为图片,用于训练。
CNN对图像大小是敏感的,Line147/148 图片resize处理为大小一致,Line149将其标准化,即减去所有图片的均值,方便训练。
接下来使用tf.train.batch函数产生训练的批次。最后将产生的批次做数据类型的转换和shape的处理即可产生用于训练的批次。
有一点比较迷惑:
Line144的label和Line149的image实际上只是一个图片的标签和对应的图片矩阵,为什么在Line151能够从一组数据中能够得到batch_size(大于1)个样本数据与标签呢????????希望高人指点一下
3.定义训练模型
a.定义权重和偏置
定义最大是64个分类,对应的就是64个人脸名称。
b.定义训练层及训练模型
采用三层神经网络进行构建训练模型。即三种层神经网络,即卷积层Line178、池化层Line183和正则化层Line186
Line189---Line 200后面的注释标识对应计算之后的矩阵大小。
c.定义损失、评估及训练方式
4.开始训练
采用协调器开启多线程,加速实现对图片文件的加载读取与训练。具体方法可以网上搜索一下。同时将训练后的模型保存下来。防止程序挂了之后需要重新训练。测试训练数据较少,201次循环及每次取10个样本,就可以达到理想的预测效果。
5.验证效果
a.训练后直接验证效果
将predict1()函数直接放在 步骤4中“开始训练” 的coord.join(threads) 的后面即可。
打印的结果即是jsonData中对应的value值,根据value值找到对应的key即可。
b.通过加载训练模板进行验证
到此为止,整个过程结束。
欢迎与大家共同讨论研究。