企业简介
云知声专注于物联网人工智能服务,拥有完全的自主知识产权、世界顶尖的智能语音识别和相关AI技术
成立于2012年6月29日,总部位于北京,在上海、深圳设有分公司。云知声利用机器学习平台(深度学习、增强学习、贝叶斯学习)语音技术,语言技术,知识计算,大数据分析等领域建立了领先的核心技术体系,这些技术共同构成了完整的人工智能技术图谱
公司在人工智能的定位
在应用层面, AI芯、AIUI、AI Service三大解决方案支撑起云知声核心技术的落地和实现,目前已经在家居、汽车、医疗和教育等领域有广泛应用,形成了完整的“云端芯”生态闭环
技术线
语音识别
拥有完全自主知识产权,世界顶尖智能语音识别技术,精准、快速、省流量
语义理解
智能对话,多领域覆盖,涵盖了衣食住行中绝大部分的使用场景,使语义理解无处不在
语音合成
合成速度超快,从文字到语音,只需要一瞬间,业内领先0.03倍实施率
声纹识别
声纹识别,安全便捷新生活,声音就是密码,自动识别说话人身份,实现快速精准的身份认证
离线操控
命令词定制,无需网络,不受网络环境因素局限,随时随地,操控自如
云知声采用金字塔式的研发方式
金字塔的底层是DeepFlow集群,DeepFlow是一个异构化硬件服务器集群,可以向上提供密集的计算和存储能力,保证团队算力支持,并计划在2018年扩展到1000GPU以上规模
中间层是Atlas超算平台,它是一个分布式机器学习并行计算平台,内部协同共享AI底层研发技术结果,可以迁移复用到各个领域的应用
而金字塔的顶层则是应用层技术,比如ASR,TTS,NLU等应用层技术的输出
在芯片方面
云知声和英伟达的GPU用来支撑高计算量,google的TPU用来做云端的认知决策不同,它将重心放在了终端上,而终端芯片的特点是由应用场景定义整个芯片的产品形态和逻辑
目前生产的UniOne即将对外发布,这一芯片将重心放在了IOT人机交互场景,之所以这样定位,是由于AI算法对设备端芯片的并行运算能力和存储器带宽提出了更高的要求,传统芯片架构难以解决,而且GPU虽然能在终端实现推理算法,但是功耗大,性价比低,IOT设备需求碎片化严重,形态多样,所以只有从具体的设备应用场景出发,设计定制化的芯片架构,才能在大幅度提升性能的同时,将低功耗和成本,同时满足AI算力和跨设备形态的需求,达到成本,功耗,算力等多维需求之间的平衡
现在很多企业采用模组组装的模式,好处是能够快速出货,但为了减少成本,很多时候都选择计算能力比较差的芯片,东拼西凑之后就会出现良品率低的问题,所以云知声认为一开始对芯片的定位很重要,要想清楚未来生态是什么,客户在哪里
产品线
通俗来说,云知声就是以AI作为核心,通过云端芯的架构体系将其具象出来,应用到不同的场景
云端芯战略,重点布局家居,车载,医疗
云
提供云端智能服务,如:医疗端:AIUI
端
解决终端智能交互,如:车载
芯
解决终端感知,如:家居
后期发展趋势:前端语音交互提供入口,将家和车的ID打通,后端互联网提供服务
产品
云知声物联网·智能开放平台
云知声借助云计算平台和移动互联网技术,广泛在移动互联网、智能家电、可穿戴设备、车载导航、医疗、教育、呼叫中心等领域,实现用户与设备及设备与设备之间的互联互通互动更大范围的帮助传统行业实现互联网化。
语音魔方
语音魔方是智能语音交互的整体解决方案,让智能设备听懂用户的话,用户说话就能实现操作和控制;方案适用于智能电视、智能家居、车载、可穿戴设备;方案整合语音识别、语义理解、知识图谱等云知声核心技术,经过数年专业语音交互的积淀和几代产品的更新,倾心打造。商业化路径:从技术到产品,软硬结合,走B2B2C路线
战略方向
其ceo黄伟说:2018年云知声的关注重点放在IOT和医疗方向,同时在智能家居,机器人方面积累的势能也会大量释放,大规模出货。
解决方案
智慧教育UniEdu
虽然在教育方向有很多应用场景,但云知声经过斟酌,将重心聚焦在自身AI能力建设,为客户们提供技术支撑,明确客户和云知声的业务边界
基于国内口语市场竞争激烈,教师成本攀升,质量难以保证的问题,云知声采用先进的语音测评技术和自然语言处理技术为客户提供全方位智能化的语言学习产品后台服务,将自动口语测评放在云端,从内容正确性,发音标准度,说话流利度全方位测试用户的口语表达情况
内容正确性:评估说话内容,检测是否有多词,漏词,错词
发音标准度:覆盖音素,字词,句子以及段落
说话流利度:测试整体是否流畅,清楚
同时配套人机对话考试:朗读,情景对话,三问五答等
同时为客户提供定制化增值服务,比如数据统计,基于客户产品调用测评服务整体统计数据报告;提供测评音频存储和访问的MP3数据服务;但用户历史测评数据多维分析等等
当前日调用量达到了1.5亿次
现在又开展了中文口语测评
智能家居AIOS@Home
该方案包括了麦克风阵列模组以及软件开发工具包,可用于智能音箱,家居中控,机器人等产品形态
提供服务:分为家居控制,互动娱乐,生活助理
技术程度
智能车载AIOS@Car
可应用于各类车联网设备,大屏中控,后视镜,汽车盒子等
产品性能:识别正确率:92.95%,交互成功率(能满足需求):93%
交互功能分为:导航地图,车载娱乐,智能互娱
智能医疗UniHealth
愿景:知音知医,智享医疗
云知声是首家在医疗专业领域提供语音解决方案,并拥有落地客户的企业,目前已经和100余家医院合作,覆盖23个省市
通过结合大量医疗原始数据,利用机器学习进行大规模数据挖掘和训练,定制了医疗的语音识别模型,推出了整体解决方案:智能语音录入系统,智能语音转写系统,智能语音交互系统
智能语音录入系统——标准版
医生通过口述患者病情,系统自动将语音转为文字,提高了病例录入的效率,让医生把更多的时间给患者
智能语音录入系统——医技专科班
根据医技科室的特点专门设计,优化了大量专业化的特殊单位符号,专门定制了一系列的语音命令,并支持语音结构化模板,通过语音进行填空,可快速完成一份报告,真正解放医生的双手
智能语音录入系统——中医专科班
根据中国传统中医的特点,结合中国中医科学院,以及多家中医院的病例,处方等中医语料单独训练识别模型,支持中医特色的说法以及中医药相关知识库,提供中医特色语音结构化模板
在终端上,分为PC端和APP
智能语音转写系统——会议系统
这一系统既可以将语音快速转写为文字,也可以辅助整理会议纪要,解决会议记录存在的耗费人力,耗时长,内容偏差,效率不高的问题
智能语音交互系统——寻医问询机器人
为患者提供寻医问路,就医分诊等服务,减轻导医人员的工作强度,缓解患者就医的心理压力提高患者满意度,增加医院亲和力
智能早教UniToy
该方案由标准化硬件模组,云端服务,手机APP组成,只需将硬件模组置入设备即可使用
功能亮点
陪伴守护:可通过设备与家长实时聊天
寓教于乐:通过趣味聊天对话,引导孩子自发学习诗词,礼貌,百科,常识等,不断强大孩子对知识的记忆
海量故事:可以多维度点播,模糊点播,包含儿歌,故事,寓言等
信息查询:帮助孩子了解生活信息,查天气,长辈称呼,日历,节假日等
趣味对话:考虑儿童发音的特殊性,训练定制化模型,改善孩子不愿意主动交流问题
企业合作
云知声目前的合作伙伴数量超过两万家,其中开放语音云覆盖的城市超过647个,覆盖设备超过9000万台
注
AIOT芯片——雨燕
这款芯片比市面上的芯片模组小了十倍,但性能却提升了50倍,功耗和价格大幅降低,能适用于多种产品形态
云知声第一代 UniOne 物联网 AI 芯片及解决方案——雨燕采用CPU+uDSP+DeepNet架构,支持8/16bit 向量、矩阵运算,基于深度学习网络架构,可将面向语音 AI 的并行运算性能发挥到极致,在更低成本和功耗下提供更高的算力
在架构灵活性方面,雨燕通过Scratch-Pad将主控CPU与AI加速器内部RAM相连,可提供高效的CPU与AI加速器之间的数据通道,便于CPU对AI加速器运算结果进行二次处理。另外,连接各个运算单元的可编程互联矩阵架构,提供了扩展运算指令的功能,从而进一步提升硬件架构的灵活性及可扩展性。同时,芯片采用多级多模式唤醒,从能量检测,到人类声音检测,再到唤醒词检测,针对语音设备及使用场景的定制化Power Domain等技术,可将芯片功耗降低至最低。具体而言,雨燕包括以下几大显著特征:
高性能深度学习加速:面向深度学习和语音信号处理的 AI 定制指令以及体系架构,将面向语音 AI 的并行运算性能发挥到极致,系统运算能力提升50倍以上
高性能内部互联网络:结合片内 Memory 及内部互联网络,提高片内总线带宽的利用效率提升20倍
低功耗架构:异构 AMP架构可保证高性能与低功耗的有机结合,从而获得最佳的能效比,更适合IoT场景
端云结合:混合应用架构设计,获得本地与云端能力的最佳平衡
云知声联合创始人/芯片负责人李霄寒表示,云知声不仅提供雨燕芯片和终端引擎,还将应用部分向客户开源,同时提供相应定制化工具以及云端AI能力服务。通过云端芯结合,云知声基于雨燕提供的是面向一个个具体场景如智能家居、智能音箱、智能车载等的Turn-key解决方案。
基于雨燕方案,可让客户站在更高的设计起点,以更低的成本在更短的时间内打造出更稳定可靠的产品。同时,开源的方案也可确保客户基于已提供的 AI 能力自行设计其它各种长尾产品形态,构建更为丰富的AIoT生态
思考