一、什么是对话机器人
对话机器人在本质上是一个用来模拟人类对话或聊天的计算机程序。
二、对话机器人的几种类型
2.1 什么是问答机器人
当下的智能客服是对话机器人商业落地的经典案例。各大手机厂商纷纷推出标配语音助手,金融、零售、通信等领域相继接入智能客服辅助人工……
问答机器人的本质是在特定领域的知识库中,找到和用户提出的问题语义匹配的知识点。
当顾客询问有关商品信息、售前、售后等基础问题,问答机器人能够给出及时而准确的回复,当机器人不能回答用户问题时,就会通过某种机制将顾客转接给人工客服。
因此,拥有特定领域知识库的问答机器人在知识储备上要比闲聊机器人更聪明、更专业、更准确,说它们是某一领域的专家也不为过。
针对具体情况选择相应的问答型对话解决方案,包括:
基于分类模型的问答系统;基于检索和排序的问答系统;基于句向量的语义检索系统。基于分类模型的问答系统将每个知识点各分一类,使用深度学习、机器学习等方法,效果较好。但需要较多的训练数据,且更新类别时,重新训练的成本较高,因此更适合数据足够多的静态知识库。
基于检索和排序的问答系统能实时追踪知识点的增删,从而有效弥补分类模型存在的问题。但仍然存在检索召回问题,假如用户输入的关键词没有命中知识库,系统就无法找到合适的答案。
更好的解决方案是基于句向量的语义检索。通过句向量编码器,将知识库数据和用户问题作为词编码输出,基于句向量的语义检索能实现在全量数据上的高效搜索,从而解决传统检索的召回问题。
2.2 什么是任务机器人
任务机器人在特定条件下提供信息或服务,以满足用户的特定需求,例如查流量、查话费、订票、订餐、咨询等等。由于用户需求复杂多样,任务机器人一般通过多轮对话明确用户的目的。
想要知道任务机器人是如何运作的,我们需要引入任务机器人的一个重要概念——动作(Dialog Act)。
任务型对话系统的本质是将用户的输入和系统的输出都映射为对话动作,并通过对话状态来实现上下文的理解和表示。
例如,在机器人帮助预约保洁阿姨的场景下,用户与机器人的对话对应不同的动作。
这种做法能够在特定领域下降低对话难度,从而让机器人执行合适的动作。
另外,对话管理模块(Dialog Management)是任务机器人的核心模块之一,也是对话系统的大脑。传统的对话管理方法包括基于FSM、Frame、Agenda 等不同架构的,各适用于不同的场景。
基于深度强化学习的对话管理法,通过神经网络将对话上下文直接映射为系统动作,如此更加灵活,可通过强化学习的方法进行训练,但需要大量真实的、高质量标注的对话数据来训练,只适用于有大量数据的情况。
2.3 什么是闲聊机器人
闲聊机器人的主要功能是同用户进行闲聊对话,如微软小冰、微信小微,还有较早的小黄鸡等等。
与闲聊机器人聊天时,用户没有明确的目的,机器人也没有标准答案,而是以趣味性回答取悦用户。
随着时间推移,用户的要求越来越高,他们希望聊天机器人能够具有更多功能——而不仅仅是谈天唠嗑接话茬。
同时,企业也需要不断对聊天机器人进行商业化探索,以期实现更大的商业价值。
三、对话机器人的现状
对话机器人历史悠久,从1966年MIT的精神治疗师机器人ELIZA到现在已有半个世纪。但现代意义的机器人其实还很年轻。
3.1
问答机器人
检索型单轮对话机器人得益于搜索引擎的商业成功和信息检索的快速发展,目前技术上已经比较成熟。最近学术界和工业界也积极探索深度学习技术如Word2vec、CNN和RNN等在检索型机器人中的使用,进一步提升了系统精度。虽然技术上较为成熟,但在实际应用中检索型机器人还存在不少其他问题。例如,很多企业历史上积累了大量非结构化数据,但这些数据并不能直接输进检索型机器人,而是需要事先通过人工整理。即便有些企业存在一些回答对的数据可以直接输入检索型机器人,但数量往往只有几十到几百条,非常少。可用数据的质量和数量限制了检索型机器人的精度和在工业界的广泛使用。
相较于检索型机器人,知识图谱型机器人更加年轻。大多数知识图谱型机器人还只能回答简单推理的事实类问题。这其中的一个原因是构建准确度高且覆盖面广的知识图谱极其困难,需要投入大量的人力处理数据。深度学习模型如Memory Networks等的引入可以绕过或解决这个难关吗?
3.2
任务机器人
任务型多轮对话机器人只有十来年的发展历史,目前已能较好地解决确定性高的多轮任务。但当前任务型机器人能正常工作的场景往往过于理想化,用户说的话大部分情形下都无法精确表达成act-slot-value三元组,所以在这个基础上构建的后续流程就变得很脆弱。很多学者提出了各种端到端的研究方案,试图提升任务型机器人的使用鲁棒性。但这些方案基本都需要利用海量的历史对话数据进行训练,而且效果也并未在真实复杂场景中得到过验证。
3.3 闲聊机器人
开域闲聊机器人是目前学术界的宠儿,可能是因为可改进的地方实在太多吧。纯粹的生成式模型在答复格式比较确定的应用中效果已经不错,可以应用于生产环境;但在答复格式非常灵活的情况下,它生成的答复连通顺性都未必能保证,更不用说结果的合理性。生成模型的另一个问题是它的生成结果可控性较低,效果优化也并不容易。但这方面的学术进展非常快速,很多学者已经在探索深度增强学习、GAN等新算法框架在其上的使用效果。
虽然目前对话机器人能解决的问题非常有限,短期内不可能替代人完成较复杂的工作。但这并不意味着我们无法在生成环境中使用对话机器人。寻找到适宜的使用场景,对话机器人仍能大幅提升商业效率。截止到目前,爱因互动已经成功把对话机器人应用于智能投顾、保险、理财等销售转化场景,也在电商产品的对话式发现和推荐中验证了对话机器人的作用。
如果一个对话机器人与真人能顺利沟通且不被真人发现自己是机器人,那么就说这个机器人通过了图灵测试。当然目前的对话机器人技术离这个目标还很远,但我们正在逐渐接近这个目标。随着语音识别,NLP等技术的不断发展,随着万物互联时代的到来,对话机器人的舞台将会越来越大。
四、对话机器人的未来
在未来20年,人机交互方式将发生变革。越来越多的设备将具有联网能力,这些设备如何与人进行交互将成为一个挑战。自然语言成为适应该趋势的新型交互方式,对话机器人有望取代过去的网站、如今的APP,占据新一代人机交互风口。
在未来对话机器人的产品形态下,不再是人类适应机器,而是机器适应人类,基于人工智能技术的对话机器人产品逐渐成为主流。
五、对话机器人的应用
对话机器人在人类的“苛求”下越来越智能,有人甚至预言在未来五到十年耗时耗力的沟通将会被机器人取代。对话机器人的应用实践正在逐步证明这一点。
目前,对话机器人主要适用于三类场景:
1.自然对话是唯一的交互方式
车载
智能音箱
可穿戴设备
2.用对话机器人替代人工
在线客服
智能IVR
智能外呼
3.用对话机器人提升效率和体验
智能营销
智能推荐
智能下单
我们可以通过在线营销转化需求度和在线交互需求度两个维度来考量适合对话机器人落地的领域。
不过,在技术上来讲,让机器真正理解人类语言仍然是一个艰难的挑战。对于搭建对话机器人,也许可以参考以下建议:
选择合适的场景并设定产品边界;积累足够多的训练数据;上线后持续学习和优化;让用户参与反馈;让产品体现出个性化。
六、参考文献
1. https://blog.csdn.net/qq_40027052/article/details/78723576
2. https://baijiahao.baidu.com/s?id=1627692839478064762&wfr=spider&for=pc