今天先补一下漏掉的术语解释。
之前在(一)里面有简单介绍过对话涉及的技术调用流程。不知道可以翻一下之前的文章。
1、NLU (Natural Language Understanding,):俗称人机对话,是所有支持机器理解文本内容的方法模型或任务的总称。NLU在文本信息处理处理系统中扮演着非常重要的角色,是推荐、问答、搜索等系统的必备模块;实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。
2. ASR ( Automatic Speech Recognition):语音识别,这是一个语音能力,做ai对话只需要关注效果、优化方法以及性能和资源需求,不需要过多的深入学习和理解
3. TTS text to speech:文本合成音频,在对话中,主要负责将机器人回答的文本进行合成播报给用户,完成一个交互,同样的,只需要关注效果、优化方法以及性能和资源需求,不需要过多的深入学习和理解
4. NLP:natural language process:自然语言处理,自然语言处理体包括了自然语言理解和自然语言生成两个部分;所以在很多公司里,nlu和nlp并不会有明确的区分,常常统称为nlp;然而实际上,nlp除了做对话、还能做ner(命名实体识别)、聚类、分类等做文本处理的任务可以用来做分析;
5. QA(FAQ):问答中的一问一答,在之前的文章里,我从是否需要多轮以及多轮的复杂度把对话场景分成了三种(qa、意图、多轮);这种用来处理最基本最简单的有非常明确答案的问题;
6. 意图:简单的填槽类问答:如订高铁票,对应的必须信息包含时间、起点终点、票类型等,这些通过追问和反问获得槽位信息,最终完成任务;
7. 多轮:更加复杂需要更多信息的问答,可以提供反悔、特殊情况兜底等;如办理账单分期业务;
8. 图谱问答分成两种:传统的二维表、真正的图谱问答;二维表是一种非常简化的三元组;图谱问答是为了解决传统知识库加工过于复杂且加工量过大的问题,当然图谱对于领域问答的实际落地效果以及降本效果;图谱问答也是结合NER、qa进行问答;
明天接着写