人工智能受到的关注越来越多,如今亚马逊、谷歌等科技巨头都拥有了自己的智能语音助手,并率先抢占智能家居、智能汽车等市场高地。
巨头抢占入口,看重软硬件一体
上周百度宣布的两条消息很有意思:一是宣布全资收购渡鸦科技,二是把度秘团队升级为度秘事业部,两边都向陆奇汇报工作的消息。
陆奇在内部邮件中表示,这是百度引领人工智能未来发展的重要一步,对于奠定百度智能交互平台的领先优势以及打造软硬件一体化的核心竞争力有着非常重要的意义。
可以看到,把语音智能硬件作为一切服务的入口,看重软硬件一体化的方向,几乎是各大科技公司的一种面向未来的选择。
亚马逊早在2014年底推出智能音箱 Echo,如今已成为美国使用最广的智能家居产品。根据 CIRP数据,亚马逊 Echo 系列用户至今已达到 820万。
2016年11月发售的谷歌智能音箱Home,据VoiceLabs估计,用户在去年12月24日至26日期间实现了4倍增长。
国外智能音箱的成功,让一直重押人工智能的百度也在考虑类似产品化的变现模式。
根据中国工业和信息化部电子科技信息情报研究所数据显示,预计2017年全球智能语音产业规模将达112.4亿美元,复合年均增长率达35.1%。
面对智能语音这个高达百亿美元的潜在市场,不仅是百度、亚马逊和谷歌在抢占高地,科技巨头们的智能语音卡位赛已经初具格局。
目前国外智能语音主战场上有四大巨头:谷歌(Assistant)、苹果(Siri)、微软(Cortana)和亚马逊(Alexa)。
此外,三星于去年10月收购了原Siri团队开发的Viv,预计将在新款旗舰手机Galaxy 8上推出智能语音助手,随后又联合GPU巨头英伟达投资语音科技公司SoundHound。Facebook的扎克伯格也在去年自己花费100小时完成了AI管家Jarvis的开发。
从技术基因和已有生态圈来看,亚马逊和谷歌将继续领先,亚马逊Alexa 和 OK Google/Google Assistant 将成为广泛使用的语言操作系统。目前,几乎所有的智能家居产品都可以通过 Alexa 或 Google Assistant 语音控制。
再看国内做智能语音业务的公司大概可以分为三类:
第一类是BAT,围绕自己的原有核心业务开展语音搜索功能。比如百度针对语音搜索、阿里针对电商、腾讯针对社交;
第二类,是科大讯飞、云知声这样的垂直领域的to B公司,在垂直行业内扎根很深。比如讯飞是针对教育、会议,云知声是针对家居、车载和医疗;
第三类就是to C 的公司,比如出门问问、Rokid和Vinci ,他们通过to C的爆款产品来实现语音功能。
至此,几乎国内外所有IT巨头都相继进入了语音交互市场,包括谷歌、苹果、微软、亚马逊、Facebook、三星、阿里、百度、腾讯、华为、科大讯飞,还有思必驰、云知声等创业公司,智能语音交互市场的趋势已经逐渐明朗,语音将是AI领域中最先落地的应用之一。
三个应用场景率先爆发
智能语音的市场格局虽然未定,但最易爆发的三个消费场景,家居、汽车和可穿戴,已经开始形成生态圈雏形。
2016年互联网女皇玛丽·米克(Mary Meeker)在她报告中提到,美国人使用语音的主要原因是解放双手和眼睛的交互,而应用最多的场景则是“Home”,也就是智能家居场景,其次是车载和在路上。
其中,控制智能家居是语音助手使用率高的应用场景之一,45.9%的用户用亚马逊智能语音系统Alexa控制过智能灯,30.2%的用户控制过智能恒温器。而且,智能家居相关应用的第二周用户留存率高达40%,远超语音应用平均3%的水平。
目前已经有Ring 智能门铃、Ecobee 智能恒温器、Edyn 智能园艺等采用智能语音技术的智能家居产品尝试。在2017年CES上,LG公司推出最新智能冰箱,内置亚马逊Alexa语音识别系统,在联网和设置之后,用户可以通Alexa来查看菜谱、查看冰箱内食物的过期时间,自动选择缺少的食物,并直接完成在线购物。
从智能汽车的发展步伐上来看,目前车内导航语音普及率相当之高的。比如福特在今年CES上推出了以Alexa为技术支撑的车载信息娱乐系统,用户在家里可以用语音在指定的时间点发动汽车;而当用户在开车过程中,可以用语音指令来唤醒Alexa,查询路线和目的地、询问天气、购买东西、播放音乐和有声书等。
再来看可穿戴市场,不同于智能家居和汽车的需求明确,大部分可穿戴产品都还没有成为刚需,给用户带来的价值,实际远小于内心的预期,因此语音的价值还没有完全呈现出来。
临近突破,技术不是唯一的限制
虽然业界普遍认为2017年是语音应用起步的元年,但当前的语音交互技术,特别是远场语音交互技术还没有完全成熟,就连Echo至多也就是80分的水准。这主要是由于语音交互涉及了非常复杂的技术链条,包括了声学处理、语音识别、语义理解和语音合成等核心技术。
百度首席科学家吴恩达认为,语音搜索准确率从95%提高到99%,是语音应用爆发的转折点,到2020年,至少50%的搜索将是语音搜索。在即将进入的物联网时代中,语音交互可以被视作为人机交互的入口。
针对智能语音市场爆发的关键点,搜狗公司桌面研究部和语音交互技术中心负责人王砚峰也曾谈到几点:
首先,语音识别的问题需要进一步的解决,比如远场,噪声,多说话人等问题。当然这个过程是一个渐进式的。
其次,自然语言的理解能力也要有更大的提升,机器更加懂得用户的意图,才能给用户带来更加稳定的体验,产品才真正的可用。
最后,物联网及智能家居等产业的进一步成熟,能给用户带来真正的价值,让用户在这些产品上产生切实的消费。这样产业和产品的需求就会进一步倒逼技术的进步。
因此智能语音的爆发不仅仅简单是技术层面的事情,而是从产品设计到战略能力,都要比现在有一个更好的提升。从这个角度来看,国内各厂商似乎还要加快步伐,才能迎来新一轮的技术风口。