目前,人脸关键点检测算法在安防,娱乐等领域的应用越来越多,很多创业公司,BAT等大公司,直播、美颜公司等,都有自己的产品。我们针对较为流行的几款人脸标定产品进行测试比对,分析各家产品的特点,方便技术人员学习与开发。
我们主要选择了商汤、旷视、智云视图、颜鉴、百度等公司的产品进行测试,其中商汤、旷视、智云视图的SDK都提供统一的106点关键点,颜鉴、百度提供了在线测试,没有离线的SDK可以提供测试,我们仅测试在线模型,作为参考。
人脸关键点检测算法相对来说已经比较成熟,针对2D人脸关键点,我们首先回顾一下目前较好的算法。2D人脸关键点,ERT算法采用随机蕨的方式,速度快,但是如果追求高准确度,模型较大。3000FPS算法,根据开源代码,能够做到300fps左右,但是同样模型较大。主流的方式大多采用深度学习的方式,CVPR18的两篇,一个商汤的LAB,利用边缘信息,另外SAN,训练数据进行角度等分析,这些方式都具有较好的思路,但是在移动端的实用性不强。
针对移动端106标定,我们在自己标注的1000张直播数据集上进行了测评,主要测试了商汤SDK,face++ SDK,以及智云视图的SDK。对比模型大小,运行时间,准确率。针对服务器端的准确率,我们测试了face++,百度,颜鉴,由于各家的标定数据不统一,我们只能给出一个主观的比较。
商汤face landmark(2018.04)、face++ landmark(2018.09)、HyperLandmark(2018.08)
速度(华为P10):6ms 、6ms、9ms
模型大小:1.3MB,1.6MB,2.1MB
精度(平均误差):8.3%,8.1%,9.6%
在线人脸标定:face++,百度,颜鉴。
主观打分(6个人),分为1-5个等级,分别为(5,5,4)
部分结果展示:
TBA