KNIME可以读取多种格式的文件,本文将介绍最常见的EXCEL格式的文件读取。
在KNIME中使用”Excel Reader”Node来读取excel文件。
一 “Excel Reader” Node 读取单个工作表
编辑界面如图所示,图中标示了几个关键的选项。
1.选择文件地址,可以是本地Excel文件,也可以是OneDrive中在线的Excel文件;
2.选择要读取的sheet的名字。一个Excel可能包含多个sheet,但一个Excel Reader Node只能读取一个sheet;
3.选择列名。可以自定义数字,任意选择第几行的数据作为列的名字。
4.选择读取的范围。默认读取整个表格,可以通过改变列的字母和行的数字,自定义读取表格范围。
最后运行,就可以看到结果了,如图所示。
一 “Excel Reader” Node +循环读取多个工作表
上文已介绍一个Excel Reader Node 只能读取一个sheet。但,如果一个文件中有几十个sheet,难道要编辑几十个Node吗?No,No...这显然违背了用KNIME提升工作效率的原则。下面就介绍如何使用“Excel Reader”和循环读取多个sheet。
小编根据Iris数据集中的Class列内容,将数据集分成三个sheet,分别命名Iris-virginica,Iris-versicolor,Iris-setosa.
方法很简单,只需要4个Node就可以完美地解决问题。
“Read Excel sheet Name”,故名思意,就是读取所有sheet的名字。无需特殊编辑,只需选择文件地址就可以了。运行结果只有一列,就是sheet的名字。
下面就要开始循环了。想要Excel Reader根据sheet名字挨个读取。下面一步使用“Table Row To Variable Loop Start”,将上一步结果的行也就是这里的sheet名字,作为变量,并开始循环。此Node无需设置,保持默认就好。
接下来就是”Excel Reader”了,设置在上文中详细讲过,就不赘述了。
最后,“Loop End”结束循环(无需设置)。
执行工作流,成功。是不是超级简单。