浩彬老撕曾经在《IBM SPSS Modeler最强工具书收藏系列(四)-数据读取奥秘》中提到怎么利用spss读取各种来源的数据,其中也重点介绍了如何通过odbc读取数据库数据。
考虑到数据库的数据读取相比于其他数据复杂,本文将进一步给大家介绍SPSS Modeler与数据的链接问题。
本文将使用1月份广州地区某移动监测站点PM2.5数据作为示例(该数据仅作示例使用,并非真实数据)。如果你对如何通过odbc链接读取数据库还有疑问请查看如下内容:
整个数据流如下图所示:
1数据库源节点,使用SQL查询
在前面,我们介绍了如何读取整个表格的数据,但是在实际项目当中,可能由于数据量较大或者我们只需要其中的部分数据,那么直接全表读取就显得低效了。
在【数据库源节点】中,我们可以进一步使用SQL查询数据,只需要在“模式”中选择“SQL查询”即可:
当然,考虑到用户方便,我们可以直接导入缺省值,并在缺省值上直接进行修改:
这里我们重新修改一下语句,选择广州白云区的PM2.5数据进行查询:
select
date_time,
zone,
pm25
from d.gz_pm25
where zone = '白云区'
读取后接入表格节点,查看数据。
2数据库导出节点,使用SQL建表
要将数据导回数据库当中,我们可以使用导出选项卡中的【数据库】节点。
值得注意的是,由于我们是要建表,除了按照Modeler默认建表设置外,我们还可以进一步指定,在【导出】节点中,选择模式,将进一步设定建表的内容。在模式中,除了可以使用定制的creat table命令外,我们依然可以通过图形化界面的方式定义主键和字段的类型。
设定完成后,点击运行,即可完成数据的导出。