3. Rasa2.0 学习笔记:版本迁移指南(下):1.10 to 2.0

5.Response Selectors

从2.0版开始,响应选择器是一项稳定的功能。
conversion command将自动将response.md文件,stories和nlu训练数据转换为新的yaml格式。 此外,我们还需要在stories文件中重命名response_actions,以改为使用utter_前缀。 例如:

stories:
  - story: chitchat
    steps:
    - intent: chitchat
    - action: respond_chitchat

变成

stories:
  - story: chitchat
    steps:
    - intent: chitchat
    - action: utter_chitchat

并且还需要在response.md中的response names中添加utter_前缀。 例如:

responses:
  chitchat/ask_name:
    - text: Oh yeah, I am called the retrieval bot.

  chitchat/ask_weather:
    - text: Oh, it does look sunny right now in Berlin.

变成

responses:
  utter_chitchat/ask_name:
    - text: Oh yeah, I am called the retrieval bot.

  utter_chitchat/ask_weather:
    - text: Oh, it does look sunny right now in Berlin.

最后,我们要从domain中的actions list中删除所有带有response_前缀的actions。

当定义为story时,这么做会很好,但按规则定义时,甚至会更好。 我们应该考虑将 retrieval stories转换为规则。 chitchat and FAQs documentation中有更多与此相关的信息。

现在,默认情况下对Response Selectors进行了关于检索意图标签的训练,而不是实际的响应文本。 对于大多数模型,这应该可以改善训练时间和ResponseSelector的准确性。

如果要恢复到2.0之前的默认behavior,请在ResponseSelector组件中添加use_text_as_label:true参数:

pipeline:
  # other components
  - name: ResponseSelector
    use_text_as_label: true

ResponseSelector的输出架构已更改。 输出示例如下所示:

{
  "response_selector": {
    "all_retrieval_intents": [
      "faq"
    ],
    "default": {
      "response": {
        "id": 1388783286124362000,
        "confidence": 1,
        "intent_response_key": "faq/is_legit",
        "response_templates": [
          {
            "text": "absolutely",
            "image": "https://i.imgur.com/nGF1K8f.jpg"
          },
          {
            "text": "I think so."
          }
        ]
        "template_name": "utter_faq/is_legit"
      },
      "ranking": [
        {
          "id": 1388783286124362000,
          "confidence": 1,
          "intent_response_key": "faq/is_legit"
        }
      ]
    }
  }
}

结果就是如果以前按照以下方式查询键full_retrieval_intent

response_selector_output.get("default")
                        .get("full_retrieval_intent")

现在应该执行以下操作:

response_selector_output.get("default")
                        .get("response")
                        .get("intent_response_key")

6.Unfeaturized Slots

unfeaturized类型的slots已弃用,并将在3.0版中删除。 要在对话期间忽略slot values,请将slot的Impact_conversation属性设置为false

以下代码段是不推荐使用的unfeaturized slot 的示例:

slots:
  username:
    type: unfeaturized

要将其更新为新格式,可以指定所需的数据类型text,并定义在对话期间应忽略该slot。

slots:
  username:
    type: text
    # Set `influence_conversation` to `false`
    # to ignore the slot value during the conversation.
    influence_conversation: false

如果不要求slot具有特定的数据类型,则可以使用any新的slot类型。 在对话期间,始终会忽略此slot类型,并且不会对slot值的数据类型进行任何assumptions 。

slots:
  username:
    type: any

请参阅更新的 [slotsdocumentation(https://rasa.com/docs/rasa/domain#slots) 以获取更多信息。

7. Conversation sessions

如果Domain 中不包含会话配置,则默认情况下会启用Conversation sessions 。 以前,a missing会话配置被视为禁用了conversation sessions。我们可以使用以下代码段明确禁用conversation sessions:

domain.yml
session_config:
  # A session expiration time of `0`
  # disables conversation sessions
  session_expiration_time: 0

8. Dialogue Featurization

仅当在policy configuration中明确定义了featurizers时,此部分才有意义。

不推荐使用LabelTokenizerSingleStateFeaturizer,将来会将其删除。 应该用SingleStateFeaturizer替换它,并且应该对NLU管道进行一些更改。 将带有选项intent_tokenization_flag:TrueCountVectorsFeaturizerTokenizer添加到NLU管道。

例如:

language: en
pipeline:
  - name: WhitespaceTokenizer
    intent_tokenization_flag: True
  - name: CountVectorsFeaturizer
  # other components
policies:
  # other policies
  - name: TEDPolicy
    featurizer:
    - name: SingleStateFeaturizer

BinarySingleStateFeaturizer已弃用,以后将被删除。 应该将其替换为SingleStateFeaturizer和NLU管道,其中Tokenizerintent_tokenization_flag设置为False

例如:

language: en
pipeline:
  - name: WhitespaceTokenizer
    intent_tokenization_flag: False
  # other components
policies:
  # other policies
  - name: TEDPolicy
    featurizer:
    - name: SingleStateFeaturizer

8. Deprecations

不推荐使用的event brokers FileProducer,KafkaProducer,PikaProducer和SQLProducer已被删除。 如果在endpoints.yml中使用了这些brokers,请确保使用重命名的变体:

  • FileProducer 成为 FileEventBroker
  • KafkaProducer 成为 KafkaEventBroker
  • PikaProducer 成为 PikaEventBroker
  • SQLProducer 成为 SQLEventBroker

不推荐使用的EmbeddingIntentClassifier已被删除。 如果在管道配置(config.yml)中使用了此组件,则可以将其替换为DIETClassifier。 它接受相同的配置参数。

不推荐使用的KerasPolicy已被删除。 如果在策略配置(config.yml)中使用了此组件,则可以将其替换为TEDPolicy。 它接受相同的配置参数。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352