AI语音对话技术

1. 语音交互流程简介

 1.1. AI 对话所需要的技术模块有 4 个部分 

1.1.1. 自动语音识别(Automatic Speech Recognition, ASR) 

1.1.2. 自然语言理解(Natural Language Understanding, NLU) 

1.1.3. 自然语言生成(Natural Language Generation, NLG)

 1.1.4. 文字转语音(Text to Speech, TTS) 

1.2. 

1.3. 户与设备之间的交互,主要是采用语音方式处理和完成的。

 2. 语音交互流程设计

 2.1. 交互流程的核心—意图 

2.1.1. 所谓意图,表示用户在使用应用时所做的动作(譬如:问一个问题或发送 一条指令),这些意图代表了应用的核心功能。 

2.1.2. 如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反 馈给用户;如果应用无法识别用户意图,则需要给用户友好的提示,指导用户 使用。

2.2. 如何识别意图—语义解析 

2.2.1. 对语音识别结果进行分析理解,简单来说就是将用户语音输入映射到机 器指令。  2.2.2. 它可能定义了一组包含指定的单词或短语的语法结构,用户通过说出满 足这种结构的语句,来调用意图。

2.3. 如何处理意图—云端交互 

2.3.1. 调用意图的结构化请求,向服务器请求处理后做出反馈响应。 通俗来讲该流程主要处理用户的请求,解决用户问题的答案。 

2.4. 上下文意图的处理-对话管理 

 2.4.1. 在用户进行自然对话时,可能会因为表达事情的复杂度、时间、地点、 效率等,产生具有脉络的对话过程,所有的对话元素会编织在一个连贯的线性 对话中。

 2.5. 语言合成模块 – 组织语言 

2.5.1. 根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言 句子。 

2.5.2. 同时将生成模块生成的句子转换成语音输出。(把回答的机器语言再转 换成 口语语言)

 3. 中文自然语言处理的关键技术 

 3.1. 词法分析

 3.1.1. 一般来讲,词形主要表现在对单词的前缀、后缀等的分析,而词汇则表 现在对整个词汇系统的控制。 

3.1.2. 在中文全文检索系统中,词法分析主要表现在对汉语信息进行词语切分 ,即汉语自动分词技术。 

3.1.3. 通过这种技术能够比较准确的分析用户输入信息的特征,从而完成准确 的搜索过程。它是中文全文检索技术的重要发展方向。 

3.2. 句法分析

 3.2.1. 句法分析是对用户输入的自然语言进行词汇短语的分析,目的是识别句 子的句法结构,实现自动句法分析过程。

 3.2.2. 其基本方法有线图分析法、短语结构分析、完全句法分析、局部句法分 析、依存句法分析等。 

3.3. 语义分析

 3.3.1. 语义分析是基于自然语言语义信息的一种分析方法,其不仅仅是词法分 析和句法分析这样语法水平上的分析,而是涉及到了单词、词组、句子、段落 所包含的意义

3.3.2. 其目的是从句子的语义结构表示言语的结构。中文语义分析方法是基于 语义网络的一种分析方法。语义网络则是一种结构化的,灵活、明确、简洁的 表达方式 

3.4. 语用分析 

3.4.1. 语用分析相对于语义分析又增加了对上下文、语言背景、环境等的分析 ,从文章的结构中提取到意象、人际关系等的附加信息,是一种更高级的语言 学分析。 

3.4.2. 它将语句中的内容与现实生活的细节相关联,从而形成动态的表意结构 。 

3.5. 语境分析 

3.5.1. 语境分析主要是指对原查询语篇以外的大量“空隙”进行分析从而更为正 确地解释所要查询语言的技术。

 3.5.2. 这些“空隙”包括一般的知识,特定领域的知识以及查询用户的需要等。 它将自然语言与客观的物理世界和主观的心理世界联系起来,补充完善了词法 、语义、语用分析的不足。

 4. Ai对话目前存在的问题 

4.1. 人机对话过程中,用户难免会出现表达失误的情况,导致机器对用户语言理 解出现偏差 10 

4.2. 人机对话过程中,用户难免会出现表达失误的情况,导致机器对用户语言理 解出现偏差,在这时,纠错机制对机器而言则非常重要,如缺少这个机制,用户 需要花费相当长的时间将其意图解释清楚,相应的用户体验也会十分糟糕。

 4.3. 另一方面,虽然可以很好的识别语音,但是却不能理解你的对话目的,语义 理解上有偏差。 

4.4. 因此语音交互最终需要解决的关键问题是歧义消解问题,和未知语言现象的 处理问题。 

5. 智能语音助手背后的生态服务 

5.1. Amazon Echo 的胜利在于其语音助手 Alexa 掌握的无数技能,Google Assistant 以及Google Home之所以被人看好是在于其 Android 后发优势所具备的开放性。

 5.2. 智能语音助手类的产品要想在中国落地开花,它不仅仅是简单的语音识别那 么简单,还有集成服务,一整套的中文生态、内容、服务等配套设施,是一种涵 盖很多基础能力的生态系统。 

5.3. 未来基于语音交互的语义技能,必须要能够达到几万、几十万甚至上百万种 的时候,才能促使语音交互时代操作系统真正走向成熟,未来语音交互产品的形 态和样式也将越来越丰富。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352

推荐阅读更多精彩内容