最近项目用到了es搜索引擎,行业对全文搜索引擎方面对es具有高度的评价,es基于目前最流行的开源Luence封装的搜索服务器。具有分布式,响应快速等优点。
对es的基本了解可以参考
极客wiki http://wiki.jikexueyuan.com/project/elasticsearch-definitive-guide-cn/
官网 https://www.elastic.co/products/elasticsearch
es中几个重要的概念_index,_type,_id,shards分片
联想到关系数据库中相关关系。可以做以下理解
Relational DB -> Databases -> Tables -> Rows -> Columns
Elasticsearch -> Indices -> Types -> Documents -> Fields
数据库对应es的索引index,数据库中的表table对应es的_type,数据表中的行数据对应es中的document文档,数据表中的列对应es中的field。理解好了这几个基本概念,那么继续,由于es是分布式的,默认的接口有http通信的9200接口,以及为集群通信的9300端口。
准备一台linux服务器,写文章时我的相关硬件配置如下
CentOS7,JRE8
相关软件的百度网盘地址 http://pan.baidu.com/s/1cKsXDO
其中
elasticsearch-5.5.1.tar.gz是es的文件
elasticsearch-analysis-ik-5.5.0.zip是使用maven打包后的压缩文件,只需解压就可以使用
elasticsearch-head-master.zip是es的一个插件,5.x之后需要使用node.js和grunt独立运行。
1安装es及配置
由于es的安全策略需要使用非root的用户,登陆centos后创建es组添加一个用户es密码为esearch
# groupadd es
#useradd es -g es -p esearch
#chown es:es -R /user/elasticsearch-5.5.1 //给文件夹赋予用户组和用户
如果遇到有权限相关的问题,使用chown <用户名> <文件/文件夹> 设置文件/文件夹的所属用户。例如以下的解压后的es文件,需要使用chown -R es elasticsearch-5.5.1 来设置文件夹的归属
将elasticsearch-5.5.1.tar.gz上传到centos的/opt目录下
#tar -zxvf elasticsearch-5.5.1.tar.gz //解压缩文件获得文件夹elasticsearch-5.5.1
#vi /opt/elasticsearch-5.5.1/config/elasticsearch.yml //编辑相关配置,需要如下的配置
network.host: es1.com //本来是绑定ip地址的,由于网络的问题使用域名绑定,可在/etc/hosts中添加你的ip 域名映射。
path.data: /var/elasticsearch/data //设置存放数据的目录
path.logs: /var/elasticsearch/logs //设置存放日志的目录
discovery.zen.ping.unicast.hosts: ["es1.com"] //由于集群还未搭建。这里先放自己进去.可不配置
discovery.zen.minimum_master_nodes: 1 //设置嘴下的主节点数为1 ,默认3,这里可不配置
修改后,保存文件
到此,基本配置结束,不过别急,如果你开始启动的话,肯定报错。大概有如下,java分配的内存不够,max virtual memory areas vm.max_map_count [65530] likely too low, increase to at least [262144]
max file descriptors [4096] for elasticsearch process likely too low, increase to at least [65536]
核心就这几个错误
1,修改 vi /opt/elasticsearch-5.5.1/config/jvm.properties 文件,设置-Xms256 -Xmx256。由于默认配置是2g配置,这个对于我使用虚拟机搭建的来说耗不起。。正式环境可以考虑不改。
2,修复262144问题
使用root账户执行
#sysctl -w vm.max_map_count=262144
#sysctl -a|grep vm.max_map_count //可以查看修改的结果,如果要永久生效执行以下
# cat /etc/sysctl.conf | grep -v "vm.max_map_count" > /tmp/system_sysctl.conf
# echo "vm.max_map_count=262144" >> /tmp/system_sysctl.conf
# mv /tmp/system_sysctl.conf /etc/sysctl.conf //提示是否覆盖,输入y
# cat /etc/sysctl.conf //查看更改是否有效,一般会出现以下,输出
vm.max_map_count=262144
# sysctl -p //需要使用root用户。用户之间的切换使用su username
3,修复65535问题使用root用户
# cp /etc/security/limits.conf /etc/security/limits.conf.bak
//注意一下的es hard nofile.es是指代的上面创建的es用户名
# echo "es hard nofile 65536" >> /tmp/system_limits.conf
# echo "es soft nofile 65536" >> /tmp/system_limits.conf
# mv /tmp/system_limits.conf /etc/security/limits.conf
修复完成后,启动es。(注意centos的防火墙对9200,9100,9300的限制)
#最后不知道为什么,
# /opt/elasticsearch-5.5.1/bin/ealsticsearch //需要切换到es用户执行命令,加上-d是后台启动。
此时可以看到相关的日志。如果没保存的话,使用http:ip:9200 就会回调对应的json数据。you know for search等信息。
2 插件的安装
es的head插件适用于数据查询与分析,当然不适合做监控。
在我的网盘中下载elasticsearch-head-master.zip文件
上传到/opt目录下并使用unzip elasticsearch-head-master.zip 解压,切换到对于目录下
#cd /opt/elasticsearch-head-master
由于head插件需要安装node.js和grunt。最开始我是拒绝的,因为es以前的版本是直接可以放到es的plugins目录下跟随es节点一起启动,之后就禁用了这种方式,目前以下的方案是使用grunt启动这个插件。安装好node.js环境后使用grunt server就能单独的和es节点通信,获取相关集群状态及发送命令。
2.1 安装node.js
网盘地址:http://pan.baidu.com/s/1pLPsmld 这是6.11.2.tar.xz文件,需要2步
# xz -d *.tar.xz //能获得tar文件,对tar文件再提取
#tar -xvf *.tar //获得node-v6.11.2-linux-x64文件夹,切换进入
#bin/node -v //如果没问题会出现v6.11.2
//将node的源文件路径加入到环境中去,使任何位置都可以使用node命令
# ln -s /opt/node-v6.11.2-linux-x64/bin/node /usr/local/bin/node
# ln -s /opt/node-v6.11.2-linux-x64/bin/npm /usr/local/bin/npm
至此在/usr/local/bin下加了连个软连接。接下来开始使用npm安装grunt
由于国内墙的问题,使用npm安装软件很慢,所以一般建议使用国内的镜像。
#npm config set registry http://registry.npm.taobao.org //设置淘宝源
2.2 安装grunt
切换到/opt/elasticsearch-head-master执行以下,可能需要耐心等待
# npm install grunt --save
安装成功后看到node_modules相关文件
修改es的elasticsearch.yml,添加
http.cors.enabled: true
http.cors.allow-origin: "*"
配置,方便head插件能访问到结点。
#node_modules/grunt/bin/grunt server //启动插件
使用ip:9100可以看到想界面。点击连接,就可以查看相关信息。
3. 安装中文分词器ik
在以上提供的网盘中下载elasticsearch-analysis-ik-5.5.0.zip 这个压缩文件已经使用maven package了,只需解压,并修改配置文件。切换到ed用户到/opt/elasticsearch-5.5.1/plugins
#mkdir ik
#cd ik
#unzip elasticsearch-analysis-ik-5.5.0.zip //将文件传到ik下,并解压
解压后会有些jar包和一些配置文件,由于ik需要和es的版本对应,在github上下载的最新ik版本为5.5.0和本篇使用的5.5.1不匹配。在启动es节点的时候会报错,固以下手动修改了ik的版本号为5.5.1
编辑plugin-descriptor.properties文件,修改elasticsearch.version=5.5.1
最后启动节点,会提示ik插件也加入到了es中。
最后,关于集群的搭建。和以上相似,只是额外多了对elasticsearch.yml中集群名字(集群中的节点需要一直)和节点名称配置,配置discovery.zen.ping.unicast.hosts与discovery.zen.minimum_master_nodes。其余节点可以不配置head插件。
至此强大的Elasticsearch就搭建好了。接下来准备好在API的海洋中翻滚吧。。.