人工智能里程碑：谷歌率先实现视频内容识别

摘要：在智能手机时代，图像识别、人脸识别一直是人工智能和机器学习领域的热点技术，这些技术也给手机用户带来了非常实用的功能。据外媒最新消息，在日前的一个云计算技术大会上，谷歌对外展示了一个新技术：可以识别视频中的物体和内容，这也是机器学习研究的重大新成果。过去，诸多公司已经能够利用人工智能技术，对于图片文件中的人脸或物体进行识别，比如Facebook公司就推出了人 ...

在智能手机时代，图像识别、人脸识别一直是人工智能和机器学习领域的热点技术，这些技术也给手机用户带来了非常实用的功能。据外媒最新消息，在日前的一个云计算技术大会上，谷歌对外展示了一个新技术：可以识别视频中的物体和内容，这也是机器学习研究的重大新成果。

过去，诸多公司已经能够利用人工智能技术，对于图片文件中的人脸或物体进行识别，比如Facebook公司就推出了人脸识别，从而搜寻出含有自己面孔的好友照片，或是对手机拍摄的海量照片进行分类管理。

据美国科技新闻网站TheVerge报道，日前谷歌举行了云计算相关的一个大会，在大会上，谷歌负责人工智能和机器学习研究的负责人李飞飞女士，介绍了谷歌人工智能研究的新成果，以及可以供外部开发者利用的新接口等。

李飞飞在大会上展示了“视频智能API”。通过这一技术，谷歌能够识别视频当中的各种动物、物体、风景等内容。比如在一个演示中，谷歌很快识别出视频中出现了一条达克斯狗。

在另外一个视频搜索演示中，用户搜索“沙滩”，则谷歌列出了所有含有沙滩风景的视频内容。

从功能上，这些识别技术和过去的图像识别、人脸识别存在相似之处，不过谷歌已经把识别提升到了视频的新领域。

据报道，视频识别依然是一个新技术。目前许多互联网公司无法识别视频内容，要求用户在上传时提供诸多的标签，从而利用标签作为搜索依据。未来，和图片文件的标签一样，视频的标签将成为一种落后技术。

李飞飞表示，通过视频识别技术，“我们将开始给数字星空中一个黑暗的物质照亮光芒。”

过去，谷歌已经把许多机器学习的技术及时变成了软件开发接口，让开发者应用到自己的软件产品中。据悉，谷歌也正在把上述的视频内容识别变成接口，对外开放。

视频识别将具有重大的应用场景，比如在安全、打击恐怖主义等领域，政府或者警方可以对视频画面进行实时的监控和分析，快速抓捕恐怖分子。

另外，宽带的发展已经让互联网进入了网络视频时代，短视频、视频直播等新应用不断出现，但是与此同时，视频搜索的长期落后，成为行业的一个短板。不少消费者已经发现，在一些搜索引擎的视频搜索服务中，出现了准确率太低的现象，主要原因是搜索企业对于视频内容完全无法识别，他们只能根据视频周边的文字内容、视频标题等附加信息进行搜索，这导致差错率大大提高，也影响了用户发现更多精彩的视频内容。

值得一提的是，在人工智能、机器学习和图像识别方面，谷歌和Facebook展开了一场军备竞赛。在去年的一次开发大会上，Facebook相关团队负责人也曾经表示，Facebook已经具备了成熟的图像识别技术，目前正在进行视频识别的研究，希望能够尽早识别出视频中的人脸，方便搜索好友之间发送的大量视频。

现在，谷歌已经成功实现了视频画面识别，Facebook的研究进入到何种阶段，尚不详。

人工智能里程碑：谷歌率先实现视频内容识别

推荐阅读更多精彩内容