上篇的内容侧重于实际业务,下篇给大家普及一些和技术本身相关的信息吧。
人脸识别的结果是可以调整的。
人脸识别的算法一般会设定一个阈值作为判断是否通过的标准,一般是用分数或者百分比来衡量。当比对的相似度值大于这个阈值时,结果为比对通过,否则为比对失败。
阈值的设定一般是根据人脸识别的ROC曲线(Receiver Operating Curve)进行设定。调整到5以下,大部分人都可以相似;调整到95以上,同一个人不同的照片都无法匹配。
人脸识别是否能被破解?答案是肯定的。
尽管加入了各种活体验证,比如眨眼、张嘴等等,以目前的技术来说还是会被攻破。除了3D仿真面具之外,还听过一个更666的手法是把数据库的比对源替换掉了。
现在许多贷款客户都是app线上获客,为了防止欺诈,都会加入人脸识别的环节。有位朋友拿市场上的小贷公司做了一个实验,结果10家里有7家都被绕开了。
不过,即使存在技术不成熟的因素,但如果风险可控的业务场景中,用了人脸识别之后,能将一部分的人力释放出来,那它也是非常具有应用价值的。
如果有人以LFW测试成绩来吹嘘自家技术多么牛逼,这个结论并不能成立。
LFW全称为Labeled Faces in the Wild,它是美国马萨诸塞大学的一个人脸数据集,里面大约有5000多人的1.3万张图像。腾讯、百度等公司等多家公司的测试成绩都在99%以上。
燃鹅,这个测试相当于告诉了你考试的命题和规律,各家公司只是针对算法进行优化。所以考出来的成绩多个0.1%意义没有那么大。放在实际应用当中,有的只有的70%。
类似的人脸数据集其他大学也有,比如YFD,the Yale Face Database,由耶鲁大学计算视觉与控制中心创建,有不同的光照、表情和姿态的变化,但数量较少。
个人认为比较有意思的是微软的MS-Celeb-1M 百万人脸识别挑战赛,数量级够大,而且从比赛关键指标设置上,都比较贴近实际应用,努力填补学术界和产业界之间的鸿沟。
另外,京东在去年搞过一个猪脸识别大赛,也比较有意思,这个我会在后面单独写一篇。