ElasticSearch 有一些自带的分词,如smartcn。这次是安装了ik的中文分词,其他的等待研究.
网上帖子很多,可能是因为版本问题,但是安装的时候还是遇到了不少坑,因此记录下来,便于后面人参考。
ElasticSearch 版本2.3.1;ik 版本 1.9.1
【1】 下载对应的IK版本
https://github.com/medcl/elasticsearch-analysis-ik
【2】编译elasticsearch-analysis-ik
有git的可以采用命令行下载
git clonehttps://github.com/medcl/elasticsearch-analysis-ik.git--depth=1
#没有git的,就直接在网站上点击下载即可。
#需要安装Maven,因为是pom的项目
#如果没有安装maven,执行 sudo apt-get install maven
Maven命令行编译
cd elasticsearch-analysis-ik
maven package elasticsearch-analysis-ik
#或者导入到eclipse工程中Maven 编译也可以
【3】配置
(1)maven package执行完毕后会在当前目录下生成target/releases目录,将其中的elasticsearch-analysis-ik-1.2.9.zip。拷贝到elasticsearch目录下的新建的目录plugins/analysis-ik,并解压。
(2)拷贝辞典.将analysis-ik目录下的config/ik 拷贝到elasticsearch的config目录。
(3)修改elasticsearch的配置文件,指定IK为分词工具。打开config/elasticsearch.yml,在最后添加index.analysis.analyzer.ik.type : "ik"
【4】校验
重启elasticsearch,查看启动是否正常。
浏览器上输入http://localhost:9200/_analyze?analyzer=ik&pretty=true&text=我是中国人
看到对比结果就说明IK安装成功啦。
继续研究。。。。。
PS:
1)下载的时候要使用版本匹配的ik
2)有很多帖子说直接可以用命令行安装,如下plugin install medcl/elasticsearch-analysis-ik,但是发现一堆报错,报各种配置找不到。我对比了下smartcn,elasticsearch-analysis-ik网站上下载的是源码,而smartcn已经是编译后的jar和配置了。@medcl 大侠,如果能提供编译好后的文件下载就更好啦