句子互动 | 实现支持微信小程序的聊天机器人

赵俊良

毛豆网客服总监,北京交通大学硕士,曾任北京联合大学信息学院讲师,拥有十余年嵌入式系统研发经历和智能仪器测控领域的创业经历

wechaty的小程序实现

由于项目的需求,接入了wechaty,感觉很好用,后来发现在发小程序部分还不能实现,在大神们的鼓励下,历经艰辛,改成了能用的状态。后来李卓桓建议我们提交PR,第一次给开源项目提交PR,本以为很简单,实际中也碰到了一些问题,好在都解决了。

开发环境的建立

新手做开发时,在这一步可能会花费大量的时间,我首次建立本地开发环境时,就花了一天的时间,这个时间完全可以节省下来,这里对wechaty-puppet-padpro本地开发环境的配置,做个简要说明,希望后续的开发者能更加容易的用wechaty做开发。

开发涉及到wechaty,wechaty-puppet,wechaty-puppet-padpro三个库,测试使用官方的wechaty-getting-started,各种关联错综复杂,这里需要感谢一下苏畅,在他的帮助下,我也花费了一天时间才跑通,但是在捅破窗户纸之后,发现其实也很简单

各个库之间的关联

wechaty-link.jpg
  • wechaty,wechaty-puppet,wechaty-puppet-padpro这三个库在本地都需要
    • npm i && npm run dist && npm link
    • 改动代码后需要运行 npm run dist
    • npm i之后,需要运行npm link
  • wechaty链接上本地库
npm link wechaty-puppet
npm link wechaty-puppet-padpro

  • wechaty-getting-started链接上本地wechaty
npm link wechaty

即搭建好了开发环境,使用下面的命令即可开发测试,其中WECHATY_PUPPET_PADPRO_TOKEN需要获得有效的token

ECHATY_PUPPET=wechaty-puppet-padpro WECHATY_PUPPET_PADPRO_TOKEN=puppet_padpro_xxxx node examples/some-example.js

开发测试

小程序的payload接口的定义如下

export interface MiniProgramPayload {
    appid?          : string,    // optional, appid, get from wechat (mp.weixin.qq.com)
    description?    : string,    // optional, mini program title
    pagepath?       : string,    // optional, mini program page path
    thumbnailurl?   : string,    // optional, default picture, convert to thumbnail
    title?          : string,    // optional, mini program title
    username?       : string,    // original ID, get from wechat (mp.weixin.qq.com)
}

其中username和appid可以在小程序的后台获得,有这两项,就可以发送出小程序了,但是样子是这样的

miniprogram-empty.jpg

thumbnailurl是预留的,目前还不起作用,计划未来通过这个url传送一个图片,用于小程序的封面,其余各项对应关系如下图

miniprogram-no-cover.jpg

到这一步,由于无法自动生成cdnthumbnail相关的信息,小程序还不能显示出图片,为了满足业务的需要,我们通过分析小程序xml,提取出了相关数据,硬编码在padpro里,这样终于可以发送出一个相对完整的小程序了,缺点是图片是固定的。未来如果有高手熟悉小程序cdn这部分,可以继续完善padpro。

miniprogram-padpro.jpg

关于wechaty-puppet-padpro中小程序的详细部分,可以参考如何用PadPro实现发送微信小程序

用正则表达式实现聊天机器人

我们目前的业务场景,还是比较简单的,程序里通过正则表达式就能比较好的满足我们的需求

对于时间的识别

毛豆少儿课堂小程序,初步是想通过识别出时间,设置课程提醒,所以对于时间的识别就很关键,经过测试对比,我们NLP最终选用了微软的@microsoft/recognizers-text-suite,微软NLP比较复杂,根据输入的文本,返回一个复杂的json值,在这个返回值中,找到需要字段中的时间。寻找优先级路径如下图,如果在datetime中找到有效时间,就返回,否则在time中查找,如此一级一级,如果所有字段都没有有效时间,返回空,不建立课程提醒。

nlp-gettime.jpg

一些识别歧义的处理

在文本的识别中,有一些特殊需要处理的地方

  • 特殊符号的处理

在微信文本中,经常会遇到一些表情符号,有可能会影响到识别,通过正则表达式,可以去除

var msgText = originalText.replace(/<[^>]*>?/gm, '')

还有一些文本信息,如果以空格开头,也会影响识别,下面是去除开头空格的正则表达式

msgText = msgText.replace(/(^\s*)/g, '')

  • 时间歧义

周日晚上6:30这种语言环境下,晚上6:30没有歧义,但是周日,可以看到nlp解析出两个日期,上周日和本周日,一般本周日才是我们要表达的,所以此处选用第二个结果

time1.jpg

6月9日10点这种语言环境下,会产生两个歧义四种结果,今年或明年的6月9日,上午或下午10点,所以可以看到识别的结果是四个,第二个结果正好巧合是我们需要的。

time2.jpg

而换成6月9日22点这种语言描述,时间的歧义没有了,会返回两个年的结果,今年或明年的6月9日,按照之前惯例,仍然选用第二个识别结果,就会产生误差,明年的6月9日,明显不是需要的结果。

time3.jpg
  • 九号楼的歧义

在实际测试中,在时间前会出现某某号楼这样的词语,例如下面的实例,出现九号楼,会导致识别成日期9日

building9-1.jpg

为了避免类似问题,通过正则表达式,在号楼前加入#,可以较好的解决这类问题。

    var msgText2 = msgText.replace(/号楼/g, '#号楼')

building9-2.jpg
  • 2-6点歧义

在时间识别中,还有类似2-6点这种描述,NLP会识别出6点,而我们想要的却是开始时间2点

timewithdash-1.jpg

通过正则表达式,将 (数字)-(数字)点 这种描述,改写成 (数字)点-(数字)点,就能较好的识别出开始时间

var msgText2 = msgText2.replace(/(\d+)\-(\d+)点/g, '$1点-$2点')

timewithdash-2.jpg
  • 小助手新加好友的处理

由于和客户沟通的入口,都放在微信小助手,而小助手新加好友后,微信会有自动回复:我通过了您的朋友验证请求,现在我们可以开始聊天了,其中关键词现在,会导致识别出当前时间,让小助手创建提醒,并推送给新加好友,造成不好的体验。

newfriend-1.jpg
newfriend-2.jpg

然而关键字现在也很重要,所以这里通过正则表达式,将现在我们删除,防止错误的识别,同时也能保留关键词现在

var msgText2 = msgText2.replace(/现在我们/g, '')

newfriend-3.jpg

与现有产品的挂接

经过前面的处理后,如果正确识别出了时间,就可以根据句子中的关键词,给用户推送相应的服务。目前小助手支持会议模式,直播模式和课堂模式。

    const reg = /zoom|视频会议|音频会议|演讲|群学习/g

    if(msgText.match(/直播/g)){
      let invite_url = '\n邀请连麦链接\nhttps://smh.maodou.io/invite/' + live_id + '/1234567890'
      let admin_url = '\n\n直播间后台链接\nhttps://smh.maodou.io/admin/content/course/' + live_id
        ....
    }
    else if(msgText.match(reg)){
      console.log(chalk.red('匹配到会议关键词'))
      let meeting_url
      if(msgText.match(/zoom|视频会议/g)){
        meeting_url = '\n视频会议链接\nhttps://kaihui.maodou.io/j/683175?mode=zoom'
      }
      else if(msgText.match(/音频会议/g)){
        meeting_url = '\n音频会议链接\nhttps://kaihui.maodou.io/j/683175?mode=audio'
      }
      .....
    }

实际测试效果,如下图所示

linktomaodou.jpg

demo-毛豆课堂现场的快速体验

最后,在现场做了一个毛豆课堂的demo,通过和小助手互动,我创建了课程和小程序提醒,将小程序推送给现场嘉宾,加入小程序提醒后,会收到短信上课提醒,通过短信中的链接,能很快速进入课堂进行互动。

demo.jpg

后续工作

目前,wechaty发送微信小程序,毛豆小助手的时间识别,还有许多需要改进的地方。我们希望逐步的完善,找到一个最佳的体验。

  • 完善小程序cdn图片 小程序的图片cdn地址,目前在wechaty-puppet-padpro中无法生成,如果有熟悉这部分的高手,可以接着完善

  • 挂接讯飞stt语音转文字 毛豆小助手,目前只能识别分析文本信息,计划未来可以接入讯飞语音转文字接口,让小助手具有更佳的用户体验

  • 聊天机器人训练引擎化 将代码引擎化,通过配置文件或api进行训练与更新,能让非技术人员也方便的完善机器人的训练

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,258评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,335评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,225评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,126评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,140评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,098评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,018评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,857评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,298评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,518评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,678评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,400评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,993评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,638评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,801评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,661评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,558评论 2 352

推荐阅读更多精彩内容

  • 写给自己:一次又一次与身边人的亲情链接,让我越来越发现自己挺重要的,也是挺可爱滴,加油吧!
    快乐天使_快乐飞翔阅读 251评论 0 0
  • 昨晚和老公的战友们一块吃饭,席间得知其中一位战友得有抑郁症并伴有耳鸣。其他战友都在开导他。 在等上菜的时候,我见他...
    叶子_ba33阅读 168评论 0 1
  • 童 年 记 忆 汉文楚楚 在每一个人的脑海中,都存在一些想见的、想念的笑脸;那些人,那些事,那些美好,那些泪...
    汉文楚楚阅读 213评论 0 0
  • 动力是一切物体开始的源泉,动力的来源总让我们无可奈何。 我不知道别人努力学习的原因是什么,我知道我努力学习就是想摆...
    布衣书生浩阅读 417评论 4 1