1.创建一个新工作
1. 确保已选择“ 集成”透视图。
2. 创建一个新的Job并将其命名为SortCSVFile。
3. 作业设计器将打开一个空作业。
2.添加并配置tFileInputDelimited组件
1. 将tFileInputDelimited组件添加到作业。
2. 要配置一个tFileInputDelimited_1组件,在该组件的Component视图中,单击FileName字段旁边的[...] ,从本地磁盘中选择文件,然后单击Open。
3. 要描述文件的结构,打开tFileInputDelimited_1的Schema向导,然后单击Edit schema字段旁边的[...]。
4. 单击[+]图标添加第一列,然后输入该列的详细信息。
5. 对CSV文件中的每一列重复步骤d,然后关闭“架构”向导。
3.对作业中的数据进行排序
1. 将tSortRow组件添加到Job并链接两个组件。注意:tFileInputDelimited_1组件的架构由链接的tSortRow组件继承,无需对其进行配置。
2. 要查看已继承的架构,在tSortRow组件的“组件”视图中,单击“编辑架构”旁边的[…]。
3. 要基于电影发行年份创建新的排序规则,单击[+],然后在“模式”列中单击releaseYear并通过单击desc指定排序顺序。
4. 要查看排序规则的结果,在作业设计器中添加一个tLogRow组件并链接tSortRow_1和tLogRow_1组件。
5. 要运行作业,在“作业”排序CSV文件的“运行”视图中,单击“运行”。
6. 现在,源文件中的电影将根据发行年份进行排序。
4.添加第二个排序规则
1. 要添加第二个排序规则,在tSortRow_1组件的“组件”视图中,单击(+),然后在“架构”列中选择标题。然后在排序列中,选择alpha。
2. 要运行作业,在“运行”视图中单击“运行”。
3. 现在,将按发行年份对电影进行排序,并且在每年内,将按电影标题的字母顺序对电影进行排序。
5.将作业的结果存储在文件中
1. 将tfileOutputExcel组件添加到作业设计器中,并将tLogRow_1链接到该组件。
2. 要配置输出组件,在组件的“组件”视图中,指定输出文件的路径和名称。
3. 要将标题行包含在输出文件中,选择Include Header。
4.要运行作业,在“运行”视图中单击“运行”。
5. 要检查moviesSorted.xls文件,导航到在其中创建文件的文件夹并打开文件。将显示带有排序数据的文件。
6. 为了防止排序的数据显示在“运行”视图中,右键单击tLogRow_1,然后单击停用tLogRow。
7. 要运行作业,在“运行”视图中单击“运行”。
作业再次运行。但是,“运行”视图中没有显示任何数据。