Embulk
开源的批量数据加载器,用来在不同数据库、存储设备、文件格式以及云服务间转移数据,支持:
自动识别输入的文件格式
并行和分布式执行处理
保证事务控制一致性
数据恢复
支持输入输出源需要安装插件
安装
环境要求:jdk1.6+
Linux & Mac & BSD
$ curl --create-dirs -o ~/.embulk/bin/embulk -L "https://dl.embulk.org/embulk-latest.jar"
$ chmod +x ~/.embulk/bin/embulk
$ echo 'export PATH="$HOME/.embulk/bin:$PATH"' >> ~/.bashrc
$ source ~/.bashrc
运行Example,生成CSV文件并尝试embluk
$ embulk example ./try1
$ embulk guess ./try1/seed.yml -o config.yml
$ embulk preview config.yml
$ embulk run config.yml
安装Plugin
$ embulk gem install embulk-output-command
$ embulk gem list
更多命令和配置