小伙伴们,上一篇文章给大家介绍了如何训练甄嬛体聊天机器人。更准确地说,它不能称之为聊天机器人,应该是一个文本生成器。在上文www.jianshu.com/p/752b06546277的基础上,我做了小小的改进(其实是一个朋友帮忙^_^),让模型预测出的结果不是一个词,而是一句话。实验结果如下:
图中,“风波 我 的 那一天 , 是 个 非常 晴朗 的 日子 。 乾元 十二年 八月 二十 , 。 站”这句话为输入语句;“在 在 的 说来 每 以后 它 惊住 想 的 泪 , 流露出 庄和德 庄和德 看不得 , 就是 想一想 聪明人”这句话为预测出的语句。
可以看到输出不是一个词,是一句话。大家一定会发现这个结果不能称之为“话”,因为它并不通顺,而且有些词重复出现。但是,在实验室的服务器上,将训练数据增加到10000条时,输出结果要比1000条训练数据好得多,语句中的词语不再重复,而且更加通顺,但那个结果我没有截图,我也不想为了截个图再花大量的时间去训练、生成了。想要告诉大家的是,这个结果通过增加训练数据是可以改善的。聪明的你也许不仅仅选择增加训练数据,甚至可以调整模型中的各种参数,达到一个更好的效果,期待大家的新思路。