摘要:在智能手机时代,图像识别、人脸识别一直是人工智能和机器学习领域的热点技术,这些技术也给手机用户带来了非常实用的功能。据外媒最新消息,在日前的一个云计算技术大会上,谷歌对外展示了一个新技术:可以识别视频中的物体和内容,这也是机器学习研究的重大新成果。 过去,诸多公司已经能够利用人工智能技术,对于图片文件中的人脸或物体进行识别,比如Facebook公司就推出了人 ...
在智能手机时代,图像识别、人脸识别一直是人工智能和机器学习领域的热点技术,这些技术也给手机用户带来了非常实用的功能。据外媒最新消息,在日前的一个云计算技术大会上,谷歌对外展示了一个新技术:可以识别视频中的物体和内容,这也是机器学习研究的重大新成果。
过去,诸多公司已经能够利用人工智能技术,对于图片文件中的人脸或物体进行识别,比如Facebook公司就推出了人脸识别,从而搜寻出含有自己面孔的好友照片,或是对手机拍摄的海量照片进行分类管理。
据美国科技新闻网站TheVerge报道,日前谷歌举行了云计算相关的一个大会,在大会上,谷歌负责人工智能和机器学习研究的负责人李飞飞女士,介绍了谷歌人工智能研究的新成果,以及可以供外部开发者利用的新接口等。
李飞飞在大会上展示了“视频智能API”。通过这一技术,谷歌能够识别视频当中的各种动物、物体、风景等内容。比如在一个演示中,谷歌很快识别出视频中出现了一条达克斯狗。
在另外一个视频搜索演示中,用户搜索“沙滩”,则谷歌列出了所有含有沙滩风景的视频内容。
从功能上,这些识别技术和过去的图像识别、人脸识别存在相似之处,不过谷歌已经把识别提升到了视频的新领域。
据报道,视频识别依然是一个新技术。目前许多互联网公司无法识别视频内容,要求用户在上传时提供诸多的标签,从而利用标签作为搜索依据。未来,和图片文件的标签一样,视频的标签将成为一种落后技术。
李飞飞表示,通过视频识别技术,“我们将开始给数字星空中一个黑暗的物质照亮光芒。”
过去,谷歌已经把许多机器学习的技术及时变成了软件开发接口,让开发者应用到自己的软件产品中。据悉,谷歌也正在把上述的视频内容识别变成接口,对外开放。
视频识别将具有重大的应用场景,比如在安全、打击恐怖主义等领域,政府或者警方可以对视频画面进行实时的监控和分析,快速抓捕恐怖分子。
另外,宽带的发展已经让互联网进入了网络视频时代,短视频、视频直播等新应用不断出现,但是与此同时,视频搜索的长期落后,成为行业的一个短板。不少消费者已经发现,在一些搜索引擎的视频搜索服务中,出现了准确率太低的现象,主要原因是搜索企业对于视频内容完全无法识别,他们只能根据视频周边的文字内容、视频标题等附加信息进行搜索,这导致差错率大大提高,也影响了用户发现更多精彩的视频内容。
值得一提的是,在人工智能、机器学习和图像识别方面,谷歌和Facebook展开了一场军备竞赛。在去年的一次开发大会上,Facebook相关团队负责人也曾经表示,Facebook已经具备了成熟的图像识别技术,目前正在进行视频识别的研究,希望能够尽早识别出视频中的人脸,方便搜索好友之间发送的大量视频。
现在,谷歌已经成功实现了视频画面识别,Facebook的研究进入到何种阶段,尚不详。