前言
最近需要做仪表盘相关的项目,用到了ETL工具Kettle,下载链接:data-integration-kettle,这是一款基于Java开发的工具,当然,Java环境变量相关配置就不在这里说明了,不过相信大家电脑上一般也都配好了环境变量,那么理论上来说应该解压Kettle即可用才对。然而在进行数据库连接时,测试连接抛出了一个报错:
错误连接数据库 [xxx] : org.pentaho.di.core.exception.KettleDatabaseException:
Error occurred while trying to connect to the database
Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver
org.pentaho.di.core.exception.KettleDatabaseException:
Error occurred while trying to connect to the database
Driver class 'org.gjt.mm.mysql.Driver' could not be found, make sure the 'MySQL' driver (jar file) is installed.
org.gjt.mm.mysql.Driver
at org.pentaho.di.core.database.Database.normalConnect(Database.java:477)
at org.pentaho.di.core.database.Database.connect(Database.java:373)
at org.pentaho.di.core.database.Database.connect(Database.java:344)
...
解决办法
问题很明显,数据库驱动问题,相信大家在遇到这个问题查找解决方案时,肯定会搜索到千篇一律的答案,即在data-integration\lib
目录下放入mysql-connector-java.jar包即可。
可能大部分人这样操作问题会得到解决,但是很遗憾,本人在lib目录下放入各个版本的jar包后,均不起作用,进而开始思考原因。找了许久,在jdk目录C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext
下,我发现不知道什么时候被我放入了一个mysql-connector-java-8.0.16.jar包,然后有了个推测:
- Kettle基于Java启动
- 数据连接的jar包首先从jdk目录读取
- 若jdk目录不存在数据库驱动包,则从安装目录的lib目录下读取
进过测试,测试结果如下:
- 删除jdk目录下的所有数据库驱动包,删除
data-integration\lib
下的所有数据库驱动包,重启Kettle,连接数据库失败。 - 删除jdk目录下的所有数据库驱动包,在
data-integration\lib
放入mysql-connector-java-5.1.48.jar数据库驱动包,重启Kettle,连接数据库成功。 - 在jdk目录下放入mysql-connector-java-5.1.48.jar数据库驱动包,删除
data-integration\lib
下的所有数据库驱动包,重启Kettle,连接数据库成功。 - 删除jdk目录下的所有数据库驱动包,在
data-integration\lib
放入mysql-connector-java-8.0.16.jar数据库驱动包,重启Kettle,连接数据库失败。 - 在jdk目录下放入mysql-connector-java-8.0.16.jar数据库驱动包,删除
data-integration\lib
下的所有数据库驱动包,重启Kettle,连接数据库失败。 - 在jdk目录下放入mysql-connector-java-8.0.16.jar、mysql-connector-java-5.1.48.ja数据库驱动包,删除
data-integration\lib
下的所有数据库驱动包,重启Kettle,连接数据库成功。
其实到了这一步,问题的解决方案已经出来了,总结如下(后续结果为分析探讨为什么8.0+版本的jar包会失效):
- Kettle工具安装目录
data-integration\lib
放入mysql-connector-java-5.1.48.jar。 - Jdk目录
C:\Program Files\Java\jdk1.8.0_181\jre\lib\ext
放入mysql-connector-java-5.1.48.jar。 - 重启Kettle。
- 下载链接:mysql-connector-java-5.1.48 mysql-connector-java-8.0.16
后续分析
所以,问题现在变成了,为什么Kettle读取了mysql8.0+版本的数据库驱动包,仍然提示'org.gjt.mm.mysql.Driver' could not be found
?
使用解压工具将mysql-connector-java-5.1.48.jar与mysql-connector-java-8.0.16.jar包解压,可以很明显看到二者的目录结构差别:
显而易见,在5.0+的版本中,数据库驱动jar包提供了org.gjt.mm.mysql.Driver.class文件,然而在8.0+版本的数据库驱动jar包中,则根本没有这个路径,所以上述的测试中,在单独使用8.0+版本的jar包时,数据连接失败的原因也找到了,MySQL官方在新版本中更改了类文件的路径,而为了兼容性问题,Kettle仍然采用了老的路径,所以出现了可以使用低版本的jar包连接高版本数据库的情况。
那么有没有办法使用8.0+的jar包呢,或者说Kettle工具为什么要以这种方式读取数据库驱动呢,可以更改吗?继续查。
我们可以在Kettle数据库连接设置时,选择MySQL(因为本人需要连接的数据库是MySQL),点击下方特征列表,可看到对应的参数:
可以看到这里已经被定义好了,以org.gjt.mm.mysql.Driver读取,其实,在Java与MySQL数据库连接中,5.0+版本的连接连接是这样定义的:
driverClassName=com.mysql.jdbc.Driver
url=jdbc:mysql://localhost:3306/db3?userSSL=false
8.0+版本的连接连接是这样定义的:
driverClassName=com.mysql.cj.jdbc.Driver
url=jdbc:mysql://localhost:3306/db3?userSSL=false&serverTimezone=UTC
与Kettle这里预定义的class路径并不一致,那么我们要怎样才能修改这个路径呢?在特征列表里面可以直接修改,但是并没有保存的按钮,修改了也不会生效,有另外一种办法。
在Kettle设置数据库连接时,不选择MySQL,而选择Generic database的连接类型,如下:
该连接类型为自定义数据库URL,一看便知,此时和Java定义数据连接时几乎一致,所以填写自定义连接URL,自定义驱动名称即可,这里需要注意的是,8.0+版本的MySQL在连接时需要指定时区,这是上述两个版本的连接url不一致的原因,而class类文件的路径也略有不同,稍作注意即可。
使用自定义连接,终于在使用8.0+jar包的同时,正确连接到了数据库。
至此,问题应该算是圆满解决,虽然花了大量的时间,但是遇到问题,就得解决、看透问题。希望能对大家提供一点小小的帮助。
欢迎访问我的个人博客:Lemon - 万事顺遂