意图识别预处理一

在上一章里面,我讲的是一个意图识别的思路或者说流程,但是并没有给出具体实现方案。

在本章,我们给出一些细节信息。

考虑一种情况:

1.数学辅导班主要讲什么?

2.语文辅导班主要讲什么?

3.英语辅导班主要讲什么?

通过人为分析,我们可以把它界定为一类,也就是问答类。我们可以把它归结为

C主要讲的什么?C可以理解为课程。


来看另外一类问题:

1.语文课上一个月多少钱?

2.语文课上半年多少钱?

3.语文课上一年多少钱?

对于这类类问题,我们可以把它归为:语文课上T多少钱? T代表时间。

同时我们根据一开始的分析,可以把语文课替换为C。

也就是说,我们可以把它理解为:C上T多少钱?


如此,我们就可以归类用户输入的一些问题。

于是我们可以用,C主要讲的什么?C上T多少钱?

来代替一系列同类问题,它的优点就是可以更加抽象用户输入。降低认为构造训练集的时间。

具体实现,源码地址如下:https://drive.google.com/folderview?id=0B4y35FiV1wh7fngteFhHQUN2Y1B5eUJBNHZUemJYQV9VWlBUb3JlX0xBdWVZTWtSbVBneU0&usp=drive_web#list

CRF++安装还是比较简单的

1../configure

2. make

3. su

4. make install

同时如果有需要,还可以安装py包。在源码目录的python文件夹中。

CRF的具体使用方式,后面将会详细介绍。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容