无意中看到这篇博文,豁然开朗。虽然是一个很小的点,但实际应用中很容易就犯同样的错误,故而根据作者的思路,做了一个练习,并有一点新补充,记录如下。
假设有这样一个数据列:
我要筛选所有区局单位。很直观的做法是像下图这样:
这样并没什么错。确定后检查PowerQuery代码,发现如下:
= Table.SelectRows(重命名的列, each ([单位] <> "京烟零售" and [单位] <> "北京市局(公司)" and [单位] <> "物流中心" and [单位] <> "营销中心" and [单位] <> "通大物业" and [单位] <> "金健恒通"))
对这一次处理来说,这并没有什么不妥。但是,这样做的问题在于,将来原始数据更新后,我们无法确保新增的不包含“区局”二字的记录被剔除出来,那么,最后筛选出来的结果中就会混入其他不含“区局”二字的单位。这会导致难以觉察的错误。
和该博文给出的实例对照,可以发现这类筛选错误有两种情形:一是筛选的结果不包含新增数据中符合要求的结果(原博文),二是筛选结果无法排除新增数据中不符合要求的结果(本文)。
因此正确的做法应该是通过“文本包含”来筛选:
代码如下:
= Table.SelectRows(删除的列1, each Text.Contains([组织机构名称.2], "区局"))
这样做的好处是,当原始数据刷新后,新增的区局单位被筛选出来的同时,不会混入其他非区局单位。