图像识别主要用到了两个第三方的框架:OpenCV和TesseractOCR,OpenCV用来做图像处理,定位到身份证号码的区域,TesseractOCR则是对定位到的区域内的内容进行识别。
国内国外的人脸识别技术大多数在开源OPENCV等开源库上进行新规则添加,公司之间的识别正确率差异仅仅在小数点上,提升意义不大,最关键的强化方向是商业适用性,使用表现的准确率和高可用性。人脸识别技术的比较维度很多,比如图像比对级的1:1,1:N,N:N;衡量的标准和维度都不同。
OpenCV 是一个开源的计算机视觉和机器学习库。它包含成千上万优化过的算法,为各种计算机视觉应用提供了一个通用工具包。根据这个项目的关于页面,OpenCV 已被广泛运用在各种项目上,从谷歌街景的图片拼接,到交互艺术展览的技术实现中,都有 OpenCV 的身影,它已支持如 OpenCL 和 OpenGL 等现代技术,也支持如 iOS 和 Android 等平台。
OpenCV 是轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。 OpenCV用C++语言编写,它的主要接口也是C++语言,但是依然保留了大量的C语言接口。该库也有大量的Python, Java and MATLAB/OCTAVE (版本2.5)的接口。
OpenCV自带例子中,提供了boost,mlp,knearest,nbayes,svm,rtrees这些机器学习方法,进行训练和识别。
而新兴公司如雨后春笋,2011年到2016年成立的人脸识别公司超过30家,其中大部分集中在2012到2015年,这只是人脸识别热潮的一个缩影。其背后原因是计算机视觉技术背后的通用性,做人脸识别的公司往往也可以做图像识别,反过来也是一样的道理。
2014年后人脸识别才开始爆发,都是成立5年的企业。人脸识别在此前,精准率太低,低于人眼,很难应用到现实领域。
从2014年起,香港中文大学教授汤晓鸥以及其学生陆超超、孙祎,连续开发了“高斯脸”,以及基于深度学习的DeepID人脸算法,识别率首次突破人眼极限,成为行业分水岭。
2016年,中国市场的人脸识别团队暴增,全国新成立近70家人脸识别公司。在这样的环境之下,即便你有好的技术,好的产品,还得有办法脱颖而出。
2017往后的两年将进入洗牌期,如今项目中POC测试常见的只有区区十几家,而第一梯队只有四家。那些消失的团队,谁说一定没有技术好的呢?现在,李飞飞、孙剑、吴恩达,大牛们浩浩荡荡的一头扎进计算机视觉业界, 前有飞瑞斯、瑞为、科葩等老牌公司,后有云天励飞、中科视拓等新星。这个行业,正在以正在用这种疯狂的站队方式,在中国猛烈生长。
人脸识别行业在国内发展迅速,汉王、中控等老牌厂商掌控着传统的静态人脸识别加指纹考勤机,依靠价格固守着商用市场。如今不论是创业者还是投资人,都开始顿悟,计算机视觉是一个“很难不挣钱”的生意,区别只在于落地时间早晚。
目前人脸识别设备技术含量很低,产品简单,但人脸识别算法本身比较有技术含量。不管是做2B还是主打2C,每家公司都有自己的一套“核心算法”,像现在许多小型集成商,可以山寨一些产品外观和结构,但产品核心算法却无法山寨,只能加入国内外其它企业的人脸识别技术。
现在市场很混乱,不过小型厂商主要还是山寨移动端设备,如平板、移动考勤等,想做动态识别还很困难。国内人脸识别厂商在核心算法上拥有自主知识产权的极少,大部分都是使用第三方技术,如OpenCV、其它公司的收费SDK;从国内看的话,这样的小型厂家有一两百家,但拥有核心技术的厂商在国内不到10家,能大规模进行系统集成定制的也就只有四家左右。
在目前人脸识别技术不够完全成熟的情况下,其应用领域却已非常广泛,涉及到刑侦、安保、电子信息安全、互联网金融、智能硬件等在内的多个领域,按其功能来分的话,我们可以大概把它们分为如下几类:
电子身份证:将所有人的面部信息扫描归档,建立电子信息身份档案库,这个身份证将是你在网络世界通行的凭证,虽然此项应用目前还未达到应用实施阶段,但这也是人脸识别技术最大的潜力所在。
电子密码:手机、电脑、网站、app或者其他一切需要密码来识别或者保护你的身份的地方,人脸识别都可以作为一种更安全和更简便的方式来应用,比如现在已经有电脑采用人脸识别开机功能。
考勤:上班不再是“打卡”,而是“刷脸”,想代同事打个卡就变成了不可能。如果这样的考勤系统真的普及开来,上班族恐怕高兴不起来了啊!
门禁:住宅区、写字楼、政府、企业、或其他非闲杂人等不得进入的区域,人脸识别可以作为一种更精确,也更快速的方式来保障安全,原来的密码门或者刷卡初入就显得特别繁琐而笨重了!
支付:这个就是与互联网金融行业的结合了,目前这一领域也是非常的热火,马云已经在蚂蚁花呗上推出了“扫脸支付”,京东钱包也是“扫脸”解锁。相比密码或者扫码支付,安全性上显然更胜一筹。
拍照:现在相机已经具有的自动对焦和识别人脸功能,就是人脸识别技术的一种应用,当然照相时的对准人脸功能,对识别复杂性的要求非常低,只需要知道哪是“人脸”就行,至于是谁的脸则不需要判断。还有美颜相机等也是一些应用举例,精确的人脸识别在查找某人或者定制妆容方面都还是大有可为。
刑侦:公安系统追捕罪犯的应用,科幻片内,某个人的照片被放在海量的信息库里对比,瞬间找出身份信息的场景,将不再是想象。
目前国内外各大互联网科技公司在人脸是被这一块领域均有涉猎,且各自探索程度深浅不一。无论是从国外的Google、微软、Facebook,还是国内的百度、腾讯,都各自有各自的人脸识别团队。
Google:2011年07月 谷歌收购人脸识别软件公司PittPatt
Facebook:2012年6月 Facebook收购以色列脸部识别公司Face.com
微软:2012年6月 微软亚洲研究院发布人脸检测算法,面部识别系统
网易:2012年5月,网易人脸识别系统全国公测,用于邮箱登陆
腾讯:2012年下半年,优图项目组组建 ,腾讯优图团队隶属于腾讯社交网络事业群,基于整个腾讯的社交网络平台,为 QQ 空间、腾讯地图、腾讯游戏、等 50 多款产品提供图像技术支持。每天 QQ 空间有 2 亿上传图片的活跃用户,团队单日最多处理照片达 6 亿张,累计已经分析处理了超过 300 亿张照片。
百度:2012年12月 百度推出人脸识别,基于图像的全网人脸搜索
目前,国内市场上公司有几十家,技术领先者有SenseTime(商汤科技)、Face++ (旷视科技)、Linkface 、依图科技、格灵深瞳、云从科技等,这些公司对外都称识别准确率高达99.5%以上;
Face++, 2014年,获阿里巴巴旗下蚂蚁金服投资,主攻金融和监控两大行业,有子公司旷视智安;团队成员除了几名来自清华校友外,还有来自美国哥伦比亚大学、英国牛津大学和美国南加州大学的科研及开发人员,截至目前员工仅有100余人。
并且在金融、安防、零售领域分别开始了商业化探索成功发育出Face++Financial,Face++Security,Face++BI等垂直人脸验证解决方案,主要将人脸识别应用在互联网产品上,自己做研发,在美图秀秀、淘宝等互联网领域得到良好的应用,在金融领域的市场一直占据沙发前排阵营;他们一直关心的4个计算机视觉核心问题(图像分类、物体检测、语义分割和序列学习),还有核心网络训练问题、底层架构问题、深度学习平台问题,也是一直处于研究ing中。
曾经被联想、阿里投资,在2013年拿到百万元A轮投资,2014年获得2200万元B轮融资,2016年获得上亿元C轮融资,最后选择通过计算机视觉技术与NLP技术的结合,制造出能“识别万物”的智能机器人,提供硬件模组,里面内置他们家的算法。目前正在准备启动IPO的步伐,VIE架构让他们得以绕过A股,不用达到连续三年盈利的标准实现快速上市。
SenseTime(商汤科技),获IDG资本投资,主攻金融、移动互联网、安防监控三大行业;由香港中文大学的汤晓欧创建,“商汤”中的汤指的就是汤晓欧本人,汤晓鸥及其研究团队所开发的DeepID算法率先将深度学习应用到人脸识别上,在技术指标上实现了新的突破。主要案例是围绕各个美化软件与直播平台制作人脸贴图,重点强化了人脸识别的关键点检测及跟踪技术。
团队有300多号,也从当当初toC转向toB领域;成立于2014年的商汤科技选择另辟蹊径,选择用“四大美女”这个话题让人们躁动起来,到最后四大美女走了三个;商汤的网络都是自己设计的,这样对于深度学习网络的掌控力就会更强,提供SaaS服务的同时,可以通过SaaS把背后的数据拿到,再进行更多更细致的分析再次提升服务质量。
Linkface,由四位高颜值的女性创立。据人脸检测评测平台 FDDB 数据,Linkface 的人脸检测算法击败百度、腾讯,位列第一;
依图科技,最早获得真格基金100万美元天使投资,2014年完成红杉资本和高榕资本的A轮融资。2012年,朱珑创办了依图科技,在全国多地公安系统耕耘颇深,主攻公安领域,2015年后转型智能医疗领域;
云从科技:2015年4月,周曦拿到战略投资成立云从科技,同年针对金融和银行业推出了40多种解决方案,包含从算法、产品、销售、售后的全产业链打造,针对农行、建行、交行、中行及多地公安提供定制化服务。团队成员除了来自中科大的校友外,还来自中国科学院各大研究所、UIUC、IBM、NEC、MicroSoft等全球顶尖学府及研究机构;
截止2016年11月,成立一年半,研发团队扩展为200余名,为全国最大的人脸识别研发团队;核心产品是人脸识别系统及IBIS集成生物识别平台,还具备3D模型、红外活体、静默活体等技术,可根据场景需求自由调节。选择连接硬件、开发与技术,属于全产业链模式,因为人脸识别系统多数情况下需要深度定制,只有这样,才能在客户提出需求的情况下迅速反馈,修改,统一用户体验。先后由完成了天使轮和A轮融资,其中天使轮融资由佳都集团与杰翱资本联合注资6000万元。
格灵深瞳:推出来Foveacam深瞳人眼摄像机,主要应用场景是高速路口的车辆、行人抓拍,当然人脸识别也是格林深瞳没放松的安防领域,号称是98%的识别准确率。这家公司不差钱,深耕技术执着于安防领域;虽然人事上变动(2017年年前原来的CEO何搏飞离职,但还将继续担任格灵深瞳的高级顾问,他本人想赶一赶消费升级的末班车。CEO一职由联合创始人赵勇担任,原百度深度学习研究院的资深科学家邓亚峰先生担任CTO,同时引入国内安防圈一位重量级的人物担任公司总裁。)
值得注意的是,Face++, SenseTime, Linkface的首席科学家,都来自于香港中文大学汤晓鸥教授的多媒体实验室,俨然已成为人脸识别技术的“黄埔军校”。大部分人脸识别公司关注都在应用层,而商汤还关注到算法层面。如果你对商汤不熟悉,小咖秀、Faceu、熊猫直播这些APP里提供的各种面部AR特效,就是商汤提供的技术支持,只是这些商汤在宣传上很少提到。
国内的人脸识别企业:
佳都科技、科大讯飞、铂亚信息、中科奥森、 安捷天盾科技、 银晨科技、 骏聿科技、 飞瑞斯科技、 科葩信息技术、灏泷科技(上海)、 赛为智能、 智慧眼科技、 像素数据技术、清大维森科技、 瑞为信息技术、苏慧信息技狮、众智益华科技、 瑞奥风软件科技、千搜科技、威富安防、可信网络科技、一登科技。
国外的人脸识别企业:
1 美国Identix公司、2 美国Bioscrypt公司、3 德国Cognitec Systems公司、4 西班牙Herta Security公司、5 日本NEC公司、6 日本Softwise公司
人脸识别的技术发展方向:
结合三维信息:二维和三维信息融合使特征更加鲁棒
多特征融合:单一特征难以应对复杂的光照和姿态变化
大规模人脸比对:面向海量数据的人脸比对与搜索
深度学习:在大数据条件下充分发挥深度神经网络强大的学习能力
人脸识别的算法能力:拒识率、误识率、通过率,准确率
银行业务体系模式:
要想攻破银行体系就得知道银行规则:银行有一套2小时、4小时、8小时原则,即系统宕机2小时,该行就要到当地人民银行喝茶;4小时没解决,就得交报告;8小时还没解决,银行的评级就会下降,甚至关门。出于金融安全与稳定的考虑,银行一般不会轻易把技术业务交给第三方公司,而一旦确认合作方,便不会轻易改变。所以,银行在选择第三方公司时,会让具备相关资质的公司聚集在一起竞标,以选取最佳合作者。
安防业务运营体系:
尽管并不否认人工智能技术对安防效果的显著提升,但安防市场一直是以销售为强导向的线下市场,国内长期被海康威视、大华股份、东方网力三家整体方案和硬件商垄断,创业企业很难颠覆。
顾泽安防在人脸识别技术上有更多需要克服的问题。公安调取的图像和视频,一般是闭路电视这种画面清晰度不高的器材监控拍摄的,而影响人脸识别正确率的因素非常多,比如行人戴墨镜、口罩,或者抽烟时被烟雾遮挡,光线较暗或光照过度等,另外,对人脸的年月变化识别最困难。将一个人现在的外貌,与多年前拍的身份证照片做对比,难度很大。“身份证照片是5年前拍的还好,虽然有些人外貌变化也比较大,要对比10年、20年前的身份证照片就更难了。
这就要基于大数据,开发出“双层异构深度神经网络”这一针对性技术,经过大量的深度学习、总结与分析;目前绝大部分公安机关实际上还没有参与采购人脸识别技术,市场算是刚起来,场景很复杂,想要一时半会拿下市场很难。比如在交通道路管理和犯罪追踪的应用场景下,我们在看很多法制节目中都能看到,侦查人员在查案时要反复查看上千卷影像资料。这就是问题所在,镜头拍下了车辆信息,但没有机器学习和深度学习的情况下依然要动用大量人力,还没法保证准确率。
人脸识别商业模式:
从盈利模式上看,提供人脸识别技术的公司,主要是两种收费方式,一种是收取一次性技术、软件购买费,一种是按技术使用次数收费。因为B端市场来说,客户的核心要求是,产品性能、服务好,对价格相对不敏感。 但C端市场,因为目前产品需要定制化,所以谈不上方便,而且成本必然下不去,性价比不可能高。
列举人脸识别在手机APP上的一些应用
1.美图秀秀邪恶大测试:识别面部表情,给出分数和评价
2.百度图片识图功能
3.百度魔图APP推出了“PK大咖”功能,用户只需要选取一张自己的大头照,就可以通过人脸识别技术跟明星进行PK,找到与你面部形象最为相似的明星大咖
4.百度钱包APP拍照付只是说当你想买一款商品,却不知道商品的具体信息,这时候就可以用到百度钱包的拍照付,拍一下就能搜索到商品,选择购买
5.支付宝APP人脸识别登录
6.iPhoto 在苹果的iPhoto中,同样提供了人脸识别功能,用户可以将图片中的人脸和人名相匹配,该功能通过脸部检测辨别照片中的人物,再通过脸部识别找到与之特征相符的拍摄对象,帮你找到想找的人,甚至是海量的照片库也不费吹灰之力
7.图图搜是先找到淘宝上的同款,然后拿到产品tag,接着根据tag、主颜色等信息进行二次查找。最基本的技术还是相同图像查找,当然也包含了商品主体识别。
人脸识别主要测属性对比:
在人脸识别属性返回功能以范围方面,较突出的是百度人脸识别与Face++,其次是云飞科技、科大讯飞、FaceCore。
人脸识别SDK
Face++ 致力于研发世界最好的人脸技术,提供免费的API和SDK供企业和开发者调用,更有灵活的定制化服务满足不同需求。已有多家公司使用Face++技术服务,完成包括人脸搜索、定位、识别、智能美化等功能。我们旨在为合作者提供完善的技术与维护服务。
百度媒体云人脸识别服务,依托百度业界领先的人脸识别算法,提供了人脸检测、五官定位、人脸属性检测等功能。媒体云人脸识别服务通过提供一系列HTTP Restful API及跨终端平台SDK,实现人脸检测、人脸识别等的诸项功能。
利用ReKognition提供的云端人脸识别API实现的一个简单人脸识别Demo,能够识别人脸的五官、人脸的大概年龄、是否戴眼镜、是否闭眼、性别等等功能。
暂不提供新用户注册
RecoFace人脸识别SDK是瑞为自主研发的人脸识别核心算法,包括人脸检测、人脸跟踪、人脸确认与人脸识别四大核心功能,无论是识别准确度还是识别速度均处于全球领先水平。
汉王科技凭借十几年扎根模式识别领域的底蕴,早在2003年,就瞄准人脸识别技术的国际前沿,积极开展人脸识别技术的潜心研究。目前已经拥有完全自主知识产权的“双目立体”人脸识别算法(Dual Sensor)。汉王云提供免费的人脸识别API和SDK供企业和开发者调用,汉王人脸识别技术广泛应用于智能安全、身份验证等领域,还可识别表情年龄性别,应用开发最具潜力。
科大讯飞联合香港中文大学汤晓鸥教授团队,共同推出世界领先的人脸识别技术,提供人脸验证、人脸检测、人脸关键点检测等功能,识别率高达99%。核心技术源自于学术界最新的深度学习方法及其相关研究,结合大量公开和独有的训练数据集,在超级计算机上学习并提取照片特征,实现高效准确的标定和识别,致力于提供便捷准确的人脸识别技术,为移动设备交互、摄像头应用等不同场景提供强有力的技术支持。
比对人脸特征每百万张照片人脸特征平均速度100毫秒以内,识别人脸特征速度在几十毫秒内。
人脸识别的安全性:
一、目前人脸识别常见攻击手段有什么?
1 、纸片翻拍,通过打印用户的照片进行攻击;
2、 屏幕翻拍,一些3D建模技术可以驱动用户的单张照片或视频做出系统要求的摇头、张嘴、眨眼等动作;
3、 用户戴面具;
二、如何应对人脸识别漏洞?
要更有效地应对上述的人脸识别漏洞,我们不妨采用腾讯优图多维活体监测模式。
腾讯优图的多维活体监测是什么?
即通过更加复杂的多数字随机唇语,捕捉人在说话过程中嘴部的细微变化,使得视频合成造假的难度很大;并加上语音图像同步检测、人脸纹理分析、面具检测、视频防翻拍等多维度防护手段;最后将所有这些手段进行交叉融合,实现移动端+后台的强力防护体系。
具体来说:
1、对于纸片翻拍,由于纸片上的人脸是静态的,利用随机数字唇语,让用户读数字,就可以很好的拦截;
2、对于屏幕翻拍,具有成本低,可以通过软件批量执行的特点,对于活体的挑战最大,这种攻击,仍然有很多线索可以利用:
a. 翻拍的视频一定会通过显示设备播放出来,显示设备存在一些和真人不同的图像特征
b.合成的视频与真人相比,会存在一些瑕疵
c.如果是直接拿到了用户的一段视频,其嘴型变化完全符合给定的随机数字的概率很低
以上这些,用大量数据就可以学习到伪造视频和真人视频之间的区别,加上各种方法的融合,就能将拦截成功率提高到非常高的水平。
3、对于用户戴面具,由于其攻破成本较高,现在还未出现实际case,我们也提前进行了研发布防,主要利用人说话时,面部会存在比较自然的微动,而面具则没有这样的规律来防范。
另外,在实际业务中,人脸识别只是作为其中一个环节,需要与账号、密码保护、基于大数据的风控等其他综合手段一起,保证流程的高度安全。
人脸识别技术正在快速发展之中,新技术的出现总可能会被不法分子所利用。腾讯优图也在关注技术对抗,通过业务持续积累的活体攻防实战经验,构筑活体检测的坚实壁垒,同时不断创新研发新的活体检测技术,为人脸识别保驾护航。
腾讯优图产品特征:
1. 产品优势
强大的人脸训练模型:立足于腾讯社交数据大平台收集的海量人脸训练集,成功标注的千万人脸数据。
方法最全:高维LBP、PCA、LDA 联合贝叶斯、度量学习、迁移学习、深度神经网络
技术最好: 优图独创Uface深度人脸模型,LFW评测以99.65%目前世界领先。
2. 人脸验证技术(1:1识别)
人脸识别技术可以计算出两张人脸照片的相似度,从而判断是否为同一人,即1:1身份验证。优图人脸识别通过传统方法和深度学习技术结合,以微众银行远程核身为基础,实际业务中,万分之一错误率下,通过率达到95%。
3. 人脸检索技术(1:N识别)
给定一张照片,和数据库中N个人脸进行对比,给出是否为其中某一个人,或者给出排序结果,即人脸检索。1:N用于用户不需要声明身份的场景。
4.技术指标
• FAR:False Accept Rate,错误接受率,指将身份不同的两张照片,判别为相同身份,越低越好
• FRR:False Reject Rate,错误拒绝率,指将身份相同的两张照片,判别为不同身份,越低越好
这两个指标有明确的物理意义,FAR决定了系统的安全性,FRR决定了系统的易用程度,在实际中,FAR对应的风险远远高于FRR,因此,生物识别系统中,会将FAR设置为一个非常低的范围,如万分之一甚至百万分之一,在FAR固定的条件下,FRR低于5%,这样的系统才有实用价值。
• 支持最小人脸尺寸64x64
• 人脸特征尺寸1-2KB
• 1:1人脸对比500ms
现在的人脸识别大数据作战平台,主要涉及到人脸识别技术、大数据、云计算等技术的应用。在未来,逐步加入成熟的图像识别(步态、服饰、动作、发型、车辆等)、声纹识别技术,并且随着摄像机硬件的功能越来越强,所谓的《激情速度七》中的“天眼”系统会越来越完善。
完善的“天眼”还需要强大的后台系统,这个系统可以控制包括公共交通、城市电力、电子监控、银行系统、警察系统等各方面,同时将所有联网信息进行收集和整合,记录下公民的医保号、医疗记录、犯罪记录、甚至上网阅览内容、输入习惯等,结合以大数据分析时时更新后台资料。
最后,“天眼”成功运行的关键在于整合物理空间(线下)和网络空间(线上)的多源多类型大规模数据,然而目前这些数据相对独立,形成所谓的“数据孤岛”,给技术的发展带来很大不便,可以考虑从国家层面上对各种数据资源统一管理和协调,为国家安全提供更强有力的保障。