聊天机器人-对话系统技术原理

对话系统概述

  1. 开放域的对话系统
    主要支持闲聊的对话方式,用户通常不具有明确的目的性。在衡量对话的质量上以用户主观体验为主,在实现上主要为基于海量FAQ的检索方式以及端到端的方式

  2. 面向任务的对话系统
    对话过程通常具有明确的目的性,主要以完成任务为主,实现上分为基于规则基于数据两种方式。衡量面向任务的对话系统的对话质量时,至少需要知道用户所指定的任务是否被系统正确完成了。

问答系统是单轮对话,面向任务的对话系统是多轮对话。后者需要维护一个用户目标状态的表示,并且依赖于一个决策过程来完成指定的任务,因此问答系统更加关注对话过程,包括目标状态表示状态迁移,保证目标状态沿着能够完成任务的方向前进。

平时我们所说的SDS(Spoken Dialogue System),默认指的是面向任务的对话系统。

任务对话系统形式化定义

为了方便进一步讲述,接下来对面向任务对话系统的任务进行形式化定义,

符号 解释
H_x 用户的对话历史语句
H_y 系统的对话历史语句
X_n 第n轮的用户对话语句
Y_n 第n轮的系统对话语句
u_n 第n轮的用户动作
s_n 第n轮的对话状态
a_n 第n轮的系统动作

给定前n-1轮的对话历史信息,包括用户的对话历史语句
H_x=\{X_1, X_2, X_3,...,X_{n-1}\}、系统的对话历史语句H_y=\{Y_1, Y_2, Y_3,...,Y_{n-1}\}及第n轮的用户对话语句X_n,求Y_n

一个典型的对话系统结构

一些关于对话系统(Dialogue System),尤其是面向任务的对话系统(Task-Oriented Dialogue System)的设计、讲解或者论文中,我们经常会看到类似:自然语言理解(NLU)、对话管理(DM)、对话生成(NLG),这样的Pipeline。


图1:一个典型的对话系统结构 A Survey on Dialogue Systems: Recent Advances and New Frontiers [Chen et al., 2014]

一个完整的系统也确实如图所示,是由语言理解、状态跟踪、策略学习、对话生成这些模块组成的。这些模块本质上是为了解决完整的对话系统问题,而拆解出的一个个子模块,这些模块的串联,组成了整个对话系统的Pipeline。

image.png

目前主流的任务对话系统实现为模块方式,由于现有训练数据规模的限制,端到端的方式仍处于探索阶段

程序实现

这里我们用python的类来实现每个部件的接口,其中每个接口最重要的方法是forward,可以认为是一个一个的pipeline直接传递的东西。

例如,我们假设我们构建了各个部件的类:

nlu = NLU()
dst = DST()
dpl = DPL()
nlg = NLG()

# utterence是用户输入的文字
def chatbot_pipeline(utterence):
      x = nlu.forward(x)
      x = dst.forward(x)
      x = dpl.forward(x)
      x = nlg.forward(x)
      return x # 这里的x已经是系统输出的响应文字了

1. NLU

输入一句用户的自然语言(utterence),输出对应的Domain, Intent, Slots

class NaturalLanguageUnderstanding(object):
    def forward(self, utterence:str) -> UserAction:
        user_action = UserAction()
        # 处理逻辑
        return user_action

2. DST

输入一个历史对话状态和NLU的输出,输出一个新的对话状态【对话状态更新模块】

class DialogStateTracker(object):
    def forward(self,
                init_state: DialogState,
                history: List[DialogState],
                user_action: UserAction) -> DialogState:
        new_ds = DialogState()
        return new_ds

DST的主要问题是如何更新当前的对话状态

3. DPL

输入一个当前对话状态,输出一个系统行为【对话策略模块】

class DialogPolicyLearning(object):
    def forward(self,
                history:List[DialogState]) -> SystemAction:
        system_action = SystemAction()
        return system_action

4. NLG

输入一个系统行为和参数,输出一个自然语句

class NLG(object):
    def forward(self, system_action:SystemAction) -> SystemResponse:
        system_response = SystemResponse()
        return system_response
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354

推荐阅读更多精彩内容