Pentaho Data Integration(or Kettle)
解决了什么问题?
方便,搞笑的解决数据清洗(ETL)工作。
干什么的?
Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。
简介
- Data Integration官网
- Data Integration官网下载地址
- pentaho-kettle GitHub
- PDI 7.X系列之前 北理工镜像
- PDI 8.X系列 北理工镜像
Kettle变革历程。Kettle>Pentaho Data Integeration>Data Integration - Kettle
- 2003年,Matt Casters就开始了Kettle项目。打算用Java编写1个ETL工具。
- 2005年12月,Kettle从2.1版本开始进入了开源领域,一直到4.1版本遵守LGPL协议。
- 从4.2版本开始遵守Apache Licence 2.0协议。
- 2006年初,Kettle加入了开源的BI公司Pentaho, 正式命名为:Pentaho Data Integeration,简称“PDI”。
- 2017年9月20日起,Pentaho已经被合并于日立集团下的新公司: Hitachi Vantara。日立集团又以“Data Integration - Kettle”称呼改项目。
因Kettle叫法是业界主流,所以一下我们统一使用Kettle。
Kettle概念模型