2016年开始,人工智能语言这个赛道上特别拥挤,大公司加上无数小公司疯狂涌入,抢占语音入口这个赛道。进入到2018年以来,竞争尤其激烈,这其中,科大讯飞经历过热捧以及降温,也遭受过质疑,两年过去后,我们再来回望一下如今的语音赛道以及科大讯飞的发展。
根据腾讯研究院的报告,截止2017年6月,我们将AI各个方面的创业公司进行了梳理,得到如下图:
创业公司的数量最能说明该领域的热度,未在表上注明的还有人工智能通用平台这一大公司的主战场。从创业热门度,融资额度和市场前景来看,根据统计,当前创业最热门的几个领域分别为自然语言处理/语音识别,机器视觉/图像识别,机器人和自动驾驶/辅助驾驶几个大的方面。
一、行业图谱和公司位置
在大家充分认识到智能语音作为下一个时代交互入口的时候,整个赛道内竞争激烈,各路竞争对手层出不穷。科大讯飞作为整个行业的领导者,已经占据了极端重要的地位,并且在其努力下,正朝着人工智能全平台+具体行业应用的模式不断迈进。总体我们认为,科大讯飞依托其核心优势,位于人工智能产业的第一梯队最弱位置,其对手是阿里巴巴、百度、腾讯及亚马逊、谷歌等平台级别的公司,在竞争的多维度能力上,科大讯飞还需要持续发展,进行补全。
在自然语言处理和语音识别这个类别上,玩家数量可以用密密麻麻来形容。可以划归此领域中国创业公司总计为128家,占整个中国全部人工智能创业公司592家的22%。这其中,还不包括众多大公司在秀肌肉。下面是我们根据公开报道情况,整理出来的在自然语言处理和语音识别上的主要玩家和当前著名玩家,制作成简图如下:
这些公司主要是我们从公开报道中获取的信息,创业公司主要选取里面比较有特色的几个,不排除有些具有技术壁垒的公司长期蛰伏,一鸣冲天。比如我至今印象深刻的Drive.ai在那个雨夜放出的自动驾驶视频,直接使这家公司一夜爆红全球。另外在大公司方面,亚马逊、google为代表的互联网巨头也可能存在严重威胁,毕竟他们在自然语言处理方面能力不容怀疑,当前的关键可能是对中文的积累和理解应用不够深。之所以这个赛道这么拥挤,我想主要是因为以下几点:
(一)语音作为人工时代的主要入口之一,必须牢牢控制。进入人工智能时代,人机交互方式产生了巨大的革新,语音和图像交互成为新的交互主要入口,背后代表的是人工智能时代的流量入口和数据入口,所以这成为了一众互联网大公司和硬件大公司(华为、小米为代表的手机厂商)必须啃下的硬骨头。
(二)相对于创业公司最多的计算机视觉与图像领域,语音交互却更早迎来了爆发。因为语音交互要求的带宽和计算能力更低,对于硬件和基础设施的要求当前就能满足,在商业上更容易实现。图像所包含的信息量比较大,对图像进行处理需要更大的计算量和带宽,这需要硬件计算性能特别突出,还得有5G网络对大数据交换和大带宽进行支持。这就好像AR/MR需要的硬件性能远远低于VR,VR迟迟得不到爆发一样。这也是为什么相对于智能电视,智能音响这股风潮会首先到来。