背景:
1、使用postman查询出来的数据无法直接导入到es,导入es需要手动去整理查询的数据,麻烦耗时。
2、自己写一个程序去自动导出再导入,耗时较长,不经济。
3、mapping和settings都要导出一并迁移至目标服务器。
是否有一种专门用来处理es的索引导出导入的工具呢?当然有!
下载elasticdump并安装(参考官网https://www.npmjs.com/package/elasticdump)
执行导入导出操作:以索引bum_authority_collection为例
# 导出索引Mapping数据
./elasticdump --input=http://source:9200/bum_authority_collection/ --output=./bum_authority_collection.json --type=mapping
# 导出索引数据
./elasticdump --input=http://source:9200/bum_authority_collection/ --output=./bum_authority_collection_data.json --limit 1000 --type=data
#导入索引Mapping数据
./elasticdump --input=./bum_authority_collection.json --output=http://target:9200/bum_authority_collection/ --type=mapping
#导入索引数据
./elasticdump --input=./bum_authority_collection_data.json --output=http://target:9200/bum_authority_collection/ --limit 1000 --type=data
那问题来了,如果我es里索引非常多,这样一个一个去执行依然会耗时,怎么做?当然想到了shell脚本。
脚本名字为:esExportOrInput.sh
#!/bin/sh
index_name=$1
index_data=$1"_data"
index_settings=$1"_settings"
echo "开始执行"
# 导出索引Mapping数据
./elasticdump --input=http://source:9200/$index_name/ --output=./$index_name.json --type=mapping
./elasticdump --input=http://source:9200/$index_name/ --output=./$index_settings.json --type=settings
# 导出索引数据
./elasticdump --input=http://source:9200/$index_name/ --output=./$index_data.json --type=data --limit=1000
#导入索引Mapping数据
echo "执行删除目标服务的索引start:"$index_name
curl -XDELETE http://target:9200/$index_name
echo "执行删除目标服务的索引end:"$index_name
sleep 3
echo "等待三秒。。。"
./elasticdump --input=./$index_settings.json --output=http://target:9200/$index_name/ --type=settings
./elasticdump --input=./$index_name.json --output=http://target:9200/$index_name/ --type=mapping
./elasticdump --input=./$index_data.json --output=http://target:9200/$index_name/ --type=data --limit=1000
#清除生成的文件
rm -f ./$index_name.json
rm -f ./$index_settings.json
rm -f ./$index_data.json
#清除生成的文件
echo "索引"$index_name"执行完毕"
执行时候需要传递1个变量,就是索引名字index_name
温馨提示:
1、这个脚本仅仅只能在安装了elasticdump服务器上使用,脚本目录在/root/node_modules/elasticdump/bin
2、导出导入默认100条一批,可以添加--limit 每页条数 来自定义每页数量。
3、导入的时候一定要限制性settings的文件导入,在执行mapping的导入,不然会冲突,因为settings上带了uuid的唯一标识。
样例:如果我要对bum_user这个索引的数据从测试环境迁移到压测服务器target上,就这样执行命令
./esExportOrInput.sh bum_user
留个作业,可以对源服务器和目标服务器进行动态参数传递,就可以做到万能适配了,有兴趣就重写下这个脚本吧!!!