机器学习之简单的人脸识别

入门级别的拿来主义式人脸识别,主要可以用来玩一下,并不会介绍相关识别的具体原理(因为我现在也没弄清楚啊)。所以,但凡会一点python,都可以尝试一下(不会python,现学也没啥问题)。

学会之后,可以去一大堆照片中筛出女神的照片,也可以通过截取摄像头的画面看隔壁老王有没有悄悄来过你家,还可以通过识别解决“怎么证明你妈是你妈”的难题,真是居家旅行必备的无聊技能之一。

具体运行过程是啥呢?我稍微讲一下,代码在这,心急的可以现在拿去直接用直接改。

代码利用的是一个现成的库face_recognition。刷刷几步调用api就行了。

  1. 获取(并保存)已知的人物的特征
    代码会通过face_recognition.face_encodings得到人脸的特征,这个特征由numpy array表示(就是一堆数字, 就像身份证号的作用似的)。把这些特征存下来,并记录下每个特征是谁的。
    运行说明:--known 指定保存这些特征的位置(json文件位置),方便下次运行直接加载了用。第一次运行时,特征文件不存在,程序会在脚本所在目录平级目录known下去加载图片,一个一个取特征。图片名字代表人名,比如jay.jpegeason.jpeg这样。为了方便,现在程序认为一张图片就一个人,如果要有多个人(比如丧心病狂的人放一张毕业合照进来),自行改代码,不难。

  2. 获取目标人物的特征
    目标人物就是要检测的图片里的人物。还是face_recognition.face_encodings这个方法。
    运行说明:--test 指定目标图像文件。默认是程序文件所在目录的test.jpeg.

  3. 目标特征和已有特征对比,判断目标是谁
    目前,判断方法是和每个已有特征比较,求出距离。把距离最小的已有特征找出来,如果这个距离小于0.6那么基本认为就是找到了。
    说人话:过程类似于,给一个人的照片,转化成身份证号,跟已知的身份证号比较,两个同省的人的身份证号距离小,同市的距离更小, 一样的,就是本人!
    那么为啥是0.6呢?别人实验的经验之谈!我测试的时候,发现库对于亚洲人的识别并不是特别准,基本要0.4左右才能算匹配。
    测距方法,也是直接调用face_recognition.api.face_distance。其实最小的不一定就是匹配,可能次小的才是,所以,可以把距离由小到大排列,列出可能的前几个。
    当已有特征特别多时, 比如known文件夹下放了千把人(真是闲得蛋疼。。。),我写的程序的判断已经不适合用来耍了。这个时候需要一个分类器,比如用SVM,或者深度学习,具体原理就不介绍了,要不然不“简单”了。
    运行说明:结果是

jay 0.4677400889094368 True

第一个表示识别的人,第二个数字表示距离,第三个表示是否识别到了(是否小于0.6), 为False表示没有与任何已知的人匹配到。

好了,过程如此简单。那么啥时候用到了机器学习呢?生成特征的时候!face_recognition.face_encodings就是牛人们通过复杂的机器学习过程得到的一个人脸图片变成人脸特征的方式。

代码用起来很简单,我加了很多debug并且为了看性能(破电脑性能太差!)调整了一些结构,实际使用时可以根据情况随意删改。
要把代码跑起来,最困难的部分来了:安装依赖(主要是opencv和dlib,我这里有一些mac上的安装步骤:12),哈哈哈,折腾去吧!

附:
英文详细过程原理介绍,请自备梯子

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容