对话

语义理解:
1.领域分类:餐饮、旅游等
2.意图识别:LSTM/bi-LSTM输出相对独立,可以在上层加一个CRF层。
3.槽值抽取/实体抽取

对话管理:
1.状态管理:输入为状态,输出为状态
2.对话策略
rewards设计:超过一定轮数,给负;用户表达出消极的情绪,给负。

A Network-based End-to-End Trainable Task-oriented Dialogue System读书笔记

task-oriented对话系统存在的一个困难是领域特定、训练数据有限。为了解决这个问题,最近用机器学习来解决对话系统的方法都是将这个
问题看做POMDP问题,目的是用RL通过与真实用户交互来训练对话策略。然而,NLU和NLG模块仍然依赖监督学习,需要数据训练。因此,为了使RL
tractable,状态和动作空间必须仔细设计,这会限制模型的表达和学习能力。此外,reward很难设计,运行时也很难计算。
seq2seq在end-to-end non-task-oriented对话系统中比较成功,一个缺点是不方面与知识库交互回答特定领域的问题。
本篇论文将平衡这两者的优势和劣势,模型是end-to-end,不直接对user goal建模,但通过在每次对话提供relevant和appropriate的response来完成任务,
用户意图用分布式表示,从知识库中检索答案。

steps

dialogue history (modelled by a set of belief trackers)
At each turn, the system takes a sequence of tokens from the user as input and converts it into two internal representations:
a distributed representation generated by an intent network and a probability distribution over slot-value pairs called the belief state (Young et al., 2013) generated by a set of belief trackers.
然后,从belief state中选择最可能的值来形成一个访问数据库的query,然后将检索的答案和Intent network、Belief Tracker在Policy Network处结合,输入到Generation
network来生成一个response。

intent Network

job: encode a sequence of input tokens into a distributed vector representation at every turn.
way: 1. use LSTM, the last time step hidden layer is taken as the representation; 2. use CNN(Kim). Here investigate both.

Belief Trackers(Dialogue State tracking)

Current state-of-the-art belief trackers use discriminative models such as recurrent neural networks(RNN)
job:维护一个informable slot的多项式分布和一个requestable slot的二项分布,informable slot有多个value。知识库中的每个slot都有自己的tracker,每个tracker都是RNN,并用CNN做特征提取。
requestable slot不需要被tracked,也就是不需要填槽。

将本轮的用户回答和上轮的机器回答连接一起编码,用来对每轮的上下文建模。

Database Operator

Policy network

看作将系统各模块粘结在一起的胶水,输出是表示系统动作的向量,输入是由intent network、belief state和DB组成。

Generation Network

由LSTM生成一个类似模板的句子,句子中的slot和它的value被相应的替换。

Corpus

informable slot在CamRestOTGY.json文件中,这个文件包括每个slot-value pair。
Requestable slots

collecting dialogue data based on a novel pipe-lined Wizard-of-Oz framework,通过crowd-sourcing的方法收集对话语料。一共680条对话数据,在
CamRest676.json中。

具体运算

query用one-hot表示,

dialog system学习笔记和理解

https://www.csie.ntu.edu.tw/~yvchen/doc/DeepDialogue_Tutorial.pdf

https://web.stanford.edu/~jurafsky/slp3/30.pdf
dialog state tracker which maintains the current state of the dialog (which include the user’s most recent dialog act, plus the entire set of slot-filler constraints the user has expressed so far) and
the dialog policy, which decides what the system should do or say next.
dialog act, a tag which represents the interactive function of the sentence dialog act being tagged.

SimpleDS https://arxiv.org/pdf/1601.04574.pdf
deep reinforcement learning将feature learning和policy learning联合学习。Almost two decades ago, the (spoken) dialogue systems community adopted the Reinforcement Learning (RL) paradigm
since it offered the possibility to treat dialogue design as an optimisation problem, and because RL-based systems can improve their performance over time with experience.

2017年论文

最近有很多给予隐变量的相关论文,自己之前没怎么关注过,这里梳理下。对话或问答系统的趋势是让机器富有情感。

当前的神经对话模型都是lexico-syntactic级,忽略了情感内容,这篇论文提出3个方法将情感融合到encoder-decoder架构中,也是和黄民烈的做了比较。

  • Latent Intention Dialogue Models
  • Serban, 2017. A hierarchical latent variable encoder-decoder model for generating dialogues.

Serban et al. (2017) have introduced latent variables to the dialogue modelling framework, to model the underlying distribution over possible responses directly.

联合学习,包括NLU和对话管理、意图识别和填槽

multi-domain对话管理

研究小组

Experimental evaluation

如何评价How NOT To Evaluate Your Dialogue System: An Empirical Study of Unsupervised Evaluation Metrics for Dialogue Response Generation

参考

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 7,322评论 0 10
  • 早起发现快乐食间的粥变淡了 大概总是不乏失望的瞬间 自习发现数理统计并不会 背单词背单词 和玥交流了下发现四个人进...
    珍惜眼前始为真阅读 89评论 0 0
  • 还没在一起,不是不爱,是需要那个表白的时机。对了就花好月圆。不对,或许就各自别过难再续缘。 2017年9月21日 ...
    七徽阅读 1,003评论 21 28
  • “飞鸟栖息何方,风声永不消匿。”这句话不知道是从哪本杂志上看到的,并不是很懂,莫名地记忆很深刻。当初选择到离家千...
    艾_5fbf阅读 248评论 0 0