Rasa简介
Rasa框架包含四个部分:
- Rasa NLU:提取用户想要做什么和关键的上下文信息
- Rasa Core:基于对话历史,选择最优的回复和动作
- 通道(channel)和动作(action):连接对话机器人与用户及后端服务系统
- tracker store、lock store和event broker等辅助系统
1. 系统结构
Rasa的核心部分分为Rasa和Rasa SDK两部分
Rasa又可细分为Rasa NLU和Rasa Core
- Rasa
- Rasa NLU:主要负责将用户的输入转化为意图和实体信息,即自然语言理解(NLU)过程
- Rasa Core:主要负责基于当前和历史的对话记录(Rasa NLU的输出是对话记录的一部分),决策下一个动作(action),下一个动作可能是回复用户某种消息、调用用户自定义的动作类。
- Rasa SDK
帮助用户构建自定义动作的软件开发工具包(Software Development Kit, SDK)。大多数机器人通过调用外部服务来完成功能。例如天气机器人调用天气信息服务商的接口完成天气查询。
在Rasa中,这种由具体业务决定的动作被称为自定义动作(custom action)。自定义动作运行在一个单独的服务器进程中,称为动作服务器(action server)。动作服务器通过HTTP与Rasa Core通信。
另外,完整的聊天机器人需要一个友好的使用界面,Rasa通过通道(channel)支持多种即时通信软件(Instant Messaging,IM)对接Rasa。
康威定律(Conway's Law):软件系统的结构反映组织结构。
基于此理论,Rasa NLU和Rasa Core结合比较紧密,都位于Rasa的软件包中;而Rasa SDK单独为一个软件包。
通常情况下,Rasa NLU和Rasa Core由算法团队负责,而自定义动作的开发由python工程师团队负责。Rasa SDK和Rasa Core的分开设计可以使两个团队在低耦合情况下,各自独立开发,独立部署,独立改进,从而提高工作效率。
2 Rasa项目的基本流程
构建一个完整的Rasa项目工程步骤:
- 初始化项目
- 准备NLU训练数据
- 配置NLU模型
- 准备故事(story)数据
- 定义领域(domain)
- 配置Rasa Core模型
- 训练模型
- 测试机器人
- 让人们使用机器人
3 Rasa常用命令
rasa 常用命令 - python包包侠 - 博客园 (cnblogs.com)
rasa 如何写一个故事 - python包包侠 - 博客园 (cnblogs.com)
命令 | 功能 |
---|---|
rasa init | 创建一个新的项目,包含样本训练模型、配置和动作 |
rasa train | 使用NLU训练数据、故事数据和配置训练模型,默认保存训练模型到./models目录 |
rasa interactive | 交互式训练,通过和机器人对话修正可能的错误,并将对话数据导出。 |
rasa shell | 等价于执行rasa run命令,开启基于命令行界面的对话界面和机器人交流。 |
rasa run | 运行rasa服务器。用训练过的模型启动服务器 |
rasa run actions | 使用rasa动作服务器 |
rasa visualize | 生成你的故事视觉表 |
rasa test | 在任何以test_开头的文件上测试经过训练的rasa模型 |
rasa x | 在本地模式启动rasa x服务器 |
rasa -h | 显示所有可用命令 |
rasa data split nlu | 对NLU训练数据进行80/20的分割 |
rasa data convert | 在不同格式之间转换训练数据 |
rasa data validate | 检查域,NLU和会话数据是否一致 |
rasa export | 将会话从跟踪器存储导出到事件代理 |
4 创建示例项目
.
|---- actions
|---- actions.py
|---- init.py
|---- config.yml
|---- credentials.yml
|---- data
|---- nlu.yml
|---- rules.yml
|---- stories.yml
|---- domain.yml
|---- endpoints.yml
|---- tests
|---- test_stories.yml