第5节：剖析语音助手产品的设计和实现

五、语音助手产品-对话产品的设计和实现

这几年人工智能大火，语音助手也不是什么新鲜的概念了，比较有代表性的百度、苹果、谷歌、小米等等都推出了自己的语音助手，那么究竟语音助手是怎么实现的呢，由哪些技术组成呢？在语音语义产品设计的工作和传统产品设计的工作又有没有不同呢。

从用户使用层面来说，语音助手一般由两个模块构成，一个是功能性技能，还有就是兜底类技能。

功能性技能简单的说，就是用户通过语音实现平时手机app上的操作。比如在车载语音助手中，我们用语音来发起导航、听音乐、打电话；在家庭场景用语音进行视频点播，控制一些智能设备，比如灯、空调、洗衣机扫地机器人等等。

那它实际的组成的模块是怎么样的呢

一般对话助手由五个组成部分：语音识别（ASR），自然语言理解（NLU），对话管理（DM），自然语言生成（NLG）和文本到语音合成（TTS）。ASR通过深度学习技术得到了较好的解决。 NLG和TTS容易控制。对话系统设计的难点主要在于NLU和DM，这将在下面的段落中详细讨论。

（图）

语境的概念，dm的概念和组成

最后编辑于：2020.03.31 16:43:02

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

禁止转载，如需转载请通过简信或评论联系作者。