Google Duplex——能帮你订位置的 AI 电话助理

2018年的Google I/O 发布了一个能帮你打电话预约餐厅的 AI 助理,先看下视频


这个AI可以帮你打电话订座位!谷歌CEO演示Duplex

Google Duplex 通过图灵测试了吗?

Alphabet 董事长 John Hennessy 在发布会之后就宣布:“在预约领域,这个AI已经通过了图灵测试。”Hennessy 可不仅仅是这个巨型科技公司的董事长,他凭借其在CPU精简指令集(RISC)的贡献获得了计算机科学的诺贝尔奖——图灵奖。以图灵命名的奖项的得主,宣布其公司的产品通过了图灵测试,这里面有水分还是实至名归?

1950年,图灵提出了图灵测试:如果一台机器能与人类展开对话(两者物理隔离)而不被识别出其机器人身份,那么这台机器就通过测试,并被认为能够进行思考。在当年,图灵就预言人类能创造出能够思考的机器,而当时的计算机还是这样的:


Hennessy说:“在预约领域,这个AI已经通过了图灵测试。”,但是在图灵测试中,你并不能让参与测试的人类把话题仅仅限定在预约领域。可以预见的是,一旦超出领域,这个机器就会露出马脚。所以很明显,Hennessy 这个说法更多是一种营销。Google 也在博客中承认:“Google Duplex 只能在一些经过深度训练的封闭领域里进行对话,它并不能在开放领域(general conversations)开展对话。”

根据google的计划,Duplex将会通过google assistant在今年夏天测试三个领域:

1. 预约餐厅

2. 预约理发店

3. 咨询商铺在假期的营业时间

google 花了巨大的精力,目前只能支持这三个领域,甚至连预约餐厅和预约理发店都是两个不同的领域,需要分开训练。其实这正是duplex能达到这么好效果的原因,google 认为只有限制在封闭且狭窄的领域内,才能达到足够程度的训练(narrow enough to explore extensively)。

Duplex 的技术挑战

这部分主要参考了google ai的博客文章:https://ai.googleblog.com/2018/05/duplex-ai-system-for-natural-conversation.html

智能音箱不早就实现了人机对话吗

很多人都用过智能音箱,跟天猫精灵或者小爱同学聊过天,但是duplex想要实现的目标难度要比这高几个级数。

当我们了解到我们正在跟一台机器对话的时候,我们会有意识的放慢说话的速度,而且会尽量使用短句说清晰;而人和人之间对话,我们会使用更复杂的句子,我们会在说到一半的时候纠正前面的话,我们会对同一件事说好几次,我们会依靠上下文而在说话中忽略一些词,我们有时会在一个句子中表达多个意图,google举了一个在测试中遇到的真实例子:“So umm Tuesday through Thursday we are open 11 to 2, and then reopen 4 to 9, and then Friday, Saturday, Sunday we... or Friday, Saturday we're open 11 to 9 and then Sunday we're open 1 to 9.

而 google 的目标是让客服觉得电话另一端预约的是一个真人,因为一旦客服知道到对面只是一个机器人的话,预约的任务很有可能就会失败;正如我们收到录音的垃圾电话,一旦察觉到是录音就会马上挂掉。所以Dulex的挑战比智能音箱的要大得多。

Duplex 解决了这些问题,最终达到视频呈现的效果

语音识别

如前面说,真实的对话比人机对话面临更多问题,真实的对话语速会更快,吐字没有那么清晰,而且手机通话的问题会更严重,例如背景噪声和通话音频质量的限制。Google 也承认在duplex的场景下字错率更高(we see higher word error rates),但是没有披露怎么解决这个问题。我猜测是通过语义理解cover识别的错误,例如我们人类对话中即使一句话中有些词没有听清,也可以根据其他词和上下文猜测整句话的意思。 

语义理解

在长对话中,同一个句子在不同的上下文中可能代表不同的含义。例如“OK for 4”这句话,可能表示确认时间,也可能是确认人数。句子的上下文信息通常要回溯到几个句子之前——语音识别较差的表现,让这个问题变得更加复杂。我的理解是,句子越多越长,识别错误的情况就越多,语义理解正确的难度就越高。


除了领域内的特定对话,系统还要处理日常对话的普遍问题,例如被打断(“the number is 212-”“sorry can you start over?”),请求暂停(“can you hold?[pause]thank you!”,一秒钟的暂停和两分钟的暂停有不同的含义,超过一定时间意味着对方可能忘记了电话),解释(“for next Friday”“for when?”“for Friday next week,the 18th.”),状态同步(“can you hear me?”),

下图是对话输出的一个框架图,更多技术细节请参考google博客的原文章。框架图左边是系统的输入,包括ASR识别的文本,音频特征,对话的历史,对话的参数(例如用户需要预约的服务,当前的时间)等等。最终输出的是回复的文本,最后通过TTS(语音合成)输出为音频回复用户。


语音合成(TTS)

Duplex 的语音合成让人惊诧,听上去简直像真人一样,为了达到这个效果,duplex 的TTS做了一些少见的操作

视频里面,duplex 说了一个“mm-hmm”,全场哄笑,因为表现得太真实了。google 通过用户研究,发现在对话中加入这些音节(例如e.g. “hmm”和“uh”)会让对话更自然;在真实的对话中,当我们在思考/组织语言的时候,我们会经常说这些音节。所以,Duplex 在对话中会加入这些音节,以及巧妙的停顿。

回答的延迟:在真实的对话中,如果我们说的是简单的句子,例如“hello”,我们期待的是对方能够立刻给予回应;而如果是回复一个复杂的问题,特意增加回复的延迟会让对话更自然(如果对方快速地回答一个复杂的问题,会显得像在进行知识竞赛)。Duplex 用了不同的模型来应对这两种case,在前一种case中使用更快、提供更低阈值的模型(例如语音识别和语音端点检测),最终达到的效果是低于100ms的延迟。

自我监控

Duplex 可以进行复杂的对话,但是一个系统总有边界。Duplex 有自我监控的能力,可以判断这个任务能否由系统独立完成。如果它判断系统不能完成这个任务,例如一些极其复杂的预约,它就会指派给后台的人工操作员替它完成。

一个能够知道自己能力极限的人工智能系统!

新技术的认知挑战

duplex 发布之后,引起一些人的担忧,认为 duplex 在与人类对话的时候没有披露自己机器的身份。但问题是,如果客服知道电话的对面是google的机器人,她会乐于服务吗?她为机器人提供“热情”服务的时候内心感受会是怎样的?

人类为机器服务,还是让人感觉别扭,虽然这个机器也是为另一个人类服务。或许人工智能在我们的生活普及之后,这种困惑会慢慢消失,但这需要时间。又或许,这个技术在替代人工客服上更有潜力。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容