写在前面--碎碎念
上次更新了一篇关于如何使用python自带的tkinter库实现人脸识别的界面,大致介绍了我们想达到的设计目标和tkinter库的基础知识。在这个小程序中,涉及到了摄像头调用(包括截图、存图、图片大小修改)、后台机器学习模型调用两个核心功能,还有tkinter界面的布局、美化、显示图片和模型预测结果等展示效果。
声明
由于整体实现需要深度学习网络的调用,这里不对深度学习人脸识别的具体实现进行展现解释。而且是小伙伴的项目,也涉及到他人的科研成果,所以只借用这个项目的形式针对界面部分进行详细说明,还请理解。不会提供包括深度学习模型实现在内的完整代码,伸手党请绕道。
一、初始化
1、模块导入
# -*- coding: utf-8 -*-
#代码默认python2版本,python3有出入的地方在注释中
from Tkinter import * # from tkinter import *导入tkinter库
import tkFileDialog # from tkinter import filedialog 调用文件读取弹窗模块,实现用户可以选择本地图片作为输入
from PIL import Image, ImageTk #调用图片处理模块,保证png后缀名可用
import cv2 #导入OpenCV库
import threading #多线程调用,从视频流中获取新的帧
import datetime #为保存的截图文件获取一个易读的时间相关名称
import os #调用系统命令
import caffe #导入caffe,深度学习框架调用
import filter #图片处理
import scipy.misc #以图像形式保存数组
import numpy as np #数组运算
import re #正则表达式匹配操作
import linecache #把文件读入到缓存中,在以后访问文件的时候,就不必要再从硬盘读取
2、变量定义
#全局变量
filename = "" #初始文件名
synname = "" #添加扰动后的合成文件名
flag = int(0)
var3 = ""
3、网络初始化
根据调用网络,进行初始化操作:略
这个对深度学习有研究的同学来说应该不是问题~~
二、界面模块与内部功能对应关系
三、界面设置
if __name__ == '__main__':
root = Tk()
frame = Frame(root,bg='#3b3a4a')#设置背景颜色
frame.pack(expand=YES,fill=BOTH,anchor='n')#背景颜色填充整个窗口
root.title("人脸识别演示")#设置窗口标题
root.geometry("800x600")#注意中间是小写x
root.iconbitmap('muma.ico')#设置窗口标题栏小logo,注意需要是ico格式
#选择图片按钮
Button(frame,text="选择文件",command=get_file,height=1,width=8,bg='#1ebad6',font=('微软雅黑',14)).grid(row=4,column=1,padx=10)
Button(frame,text="拍照截图",command=shot_pic,height=1,width=8,bg='#1ebad6',font=('微软雅黑',14)).grid(row=5,column=1,padx=10)
#选择扰动按钮
Button(frame,text="选择扰动",command=get_trg,height=1,width=8,bg='#1ebad6',font=('微软雅黑',14)).grid(row=12,column=1,padx=10,sticky=S)
#添加显示原始图片的背景图片
img1 = Image.open("picbg.png")
photo1 = ImageTk.PhotoImage(img1)
img_label1 = Label(frame, imag=photo1,bd=0)
img_label1.grid(row=4,column=2,rowspan=3,columnspan=3,padx=4,pady=10)
#添加显示合成图片的背景图片
img2 = Image.open("picbg.png")
photo2 = ImageTk.PhotoImage(img2)
img_label2 = Label(frame, imag=photo2,bd=0)
img_label2.grid(row=12,column=2,rowspan=3,columnspan=3,padx=4,pady=20)
#显示图片标签
frm_L0 = Frame(frame)
var0 = StringVar()
Label(frm_L0,text="图片标签:").pack(side=LEFT)
Entry(frm_L0,textvariable=var0,bd=0).pack(side=LEFT)
frm_L0.grid(row=7,column=3)
#选择原始图片训练模型
Button(frame, text="原始模型", command=can_data1, height=1, width=8,font=('微软雅黑',12),activebackground='pink', bg='#161626',fg='#f2f2f4',bd=1).grid(row=4, column=6,padx=4,pady=10)
Button(frame, text="修改模型", command=can_data2, height=1, width=8,font=('微软雅黑',12),activebackground='pink', bg='#c0c0c8',bd=1).grid(row=5, column=6,padx=4,pady=10)
#选择合成图片训练模型
Button(frame, text="原始模型", command=can_data3, height=1, width=8,font=('微软雅黑',12),activebackground='pink', bg='#161626',fg='#f2f2f4',bd=1).grid(row=12, column=6,padx=4,pady=10)
Button(frame, text="修改模型", command=can_data4, height=1, width=8,font=('微软雅黑',12),activebackground='pink', bg='#c0c0c8',bd=1).grid(row=13, column=6,padx=4,pady=10)
#设置原始图片处理
#设置原始模型预测结果的显示框
nfrm_L1 = Frame(frame)
var11 = StringVar()
var11.set("")
Label(nfrm_L1, text="分类结果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L1, textvariable=var11,bd=0).pack()
nfrm_L1.grid(row=4, column=8,padx=2)
#设置原始预测结果置信度的显示框
nfrm_L2 = Frame(frame)
var12 = StringVar()
var12.set("")
Label(nfrm_L2, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L2, textvariable=var12, bd=0).pack()
nfrm_L2.grid(row=4,column=9,padx=2)
#设置修改模型预测结果的显示框
mfrm_L1 = Frame(frame)
var13 = StringVar()
var13.set("")
Label(mfrm_L1,text="分类结果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L1,textvariable=var13,bd=0).pack()
mfrm_L1.grid(row=5,column=8,padx=2)
#设置修改预测结果置信度的显示框
mfrm_L2 = Frame(frame)
var14 = StringVar()
var14.set("")
Label(mfrm_L2, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L2, textvariable=var14, bd=0).pack()
mfrm_L2.grid(row=5,column=9,padx=2)
#设置合成图片处理
#设置原始模型预测结果的显示框
nfrm_L3 = Frame(frame)
var21 = StringVar()
var21.set("")
Label(nfrm_L3, text="分类结果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L3, textvariable=var21, bd=0).pack()
nfrm_L3.grid(row=12, column=8)
#设置原始预测结果置信度的显示框
nfrm_L4 = Frame(frame)
var22 = StringVar()
var22.set("")
Label(nfrm_L4, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(nfrm_L4, textvariable=var22, bd=0).pack()
nfrm_L4.grid(row=12, column=9)
#设置修改模型预测结果的显示框
mfrm_L3 = Frame(frame)
var23 = StringVar()
var23.set("")
Label(mfrm_L3,text="分类结果:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L3,textvariable=var23,bd=0).pack()
mfrm_L3.grid(row=13, column=8)
#设置修改模型预测结果置信度的显示框
mfrm_L4 = Frame(frame)
var24 = StringVar()
var24.set("")
Label(mfrm_L4, text="置信度:",bg='#c0c0c8').pack(fill=BOTH)
Entry(mfrm_L4,textvariable=var24,bd=0).pack()
mfrm_L4.grid(row=13, column=9)
root.mainloop()
四、功能实现
1、摄像头拍照截图
def shot_pic():
global flag
global filename
flag = 0
#视频窗口设置
capture = cv2.VideoCapture(0)
capture.set(cv2.CAP_PROP_FRAME_WIDTH, 640) #宽224
capture.set(cv2.CAP_PROP_FRAME_HEIGHT, 480) #高224
top = Toplevel()
top.title('camera shot')
frm_top = Frame(top)
Button(top, height=2, width=8, text='截取图片',command=stop_pic).pack(side=TOP)
canvas = Canvas(top, bg='black', height=480, width=640)
canvas.pack()
#实时获取视频
while (capture.isOpened()):
ret, frame = capture.read() #ret表示是否成功读取视频帧
if ret:
cv2image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGBA)
img = Image.fromarray(cv2image)
image_file = ImageTk.PhotoImage(img)
canvas.create_image(0, 0, anchor='nw', image=image_file, tags='c1')
frm_top.update_idletasks()
frm_top.update()
if flag==1:
cv2.imwrite("cut_img.jpg", frame) # 保存路径
img = cv2.imread('cut_img.jpg')
img = img[110:420,180:490] #高,宽
img = cv2.resize(img,(224,224))
cv2.imwrite("cut_img.jpg", img) # 保存路径
filename = "cut_img.jpg"
break
capture.release()
cv2.destroyAllWindows()
top.destroy()
#主窗口打开截图
pic_name = "cut_img.jpg"
var0.set(pic_name) #图片标签
img1 = Image.open(pic_name) # 打开图片
photo1 = ImageTk.PhotoImage(img1) # 用PIL模块的PhotoImage打开
img_label1.config(imag=photo1)
mainloop()
2、对图片进行处理
def crop(image_size, output_size, image):
topleft = ((output_size[0] - image_size[0])/2, (output_size[1] - image_size[1])/2)
return image.copy()[:,:,topleft[0]:topleft[0]+image_size[0], topleft[1]:topleft[1]+image_size[1]]
def classify(fname):
averageImage = [129.1863, 104.7624, 93.5940]
pix = scipy.misc.imread(fname)
data = np.float32(np.rollaxis(pix, 2)[::-1])
data[0] -= averageImage[2]
data[1] -= averageImage[1]
data[2] -= averageImage[0]
return np.array([data])