第5节:剖析语音助手产品的设计和实现

五、语音助手产品-对话产品的设计和实现

这几年人工智能大火,语音助手也不是什么新鲜的概念了,比较有代表性的百度、苹果、谷歌、小米等等都推出了自己的语音助手,那么究竟语音助手是怎么实现的呢,由哪些技术组成呢?在语音语义产品设计的工作和传统产品设计的工作又有没有不同呢。

从用户使用层面来说,语音助手一般由两个模块构成,一个是功能性技能,还有就是兜底类技能。

功能性技能简单的说,就是用户通过语音实现平时手机app上的操作。比如在车载语音助手中,我们用语音来发起导航、听音乐、打电话;在家庭场景用语音进行视频点播,控制一些智能设备,比如灯、空调、洗衣机扫地机器人等等。

那它实际的组成的模块是怎么样的呢

一般对话助手由五个组成部分:语音识别(ASR),自然语言理解(NLU),对话管理(DM),自然语言生成(NLG)和文本到语音合成(TTS)。ASR通过深度学习技术得到了较好的解决。 NLG和TTS容易控制。对话系统设计的难点主要在于NLU和DM,这将在下面的段落中详细讨论。

(图)

语境的概念,dm的概念和组成

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

相关阅读更多精彩内容

友情链接更多精彩内容