在这里看到作者列了用Text.Remove()函数的几个应用场景,简直太妙,忍不住转来整理如下:
去除英文大小写字母
Text.Remove([原始信息],{"A".."z"})
去除英文字符
Text.Remove([原始信息],{" ".."~"})
去除数字
Text.Remove([原始信息],{"0".."9"})
去除中文
Text.Remove([原始信息],{"一".."龥"})
总结
这里的关键是Text.Remove()函数的第二个参数,“removeChars”可以是一个list,而我们知道,list其实可以通过构造序列来生成一个有序list。而原作者举的这些例子, 说明PowerQuery是支持Unicode序列的。如果对Unicode序列非常熟悉的话,可以实现更多情形的特定字符移除。
那么作为文科生,怎么快速去找到Unicode的编码序列表呢?到微软的Office Word中去找。以Word2016为例,切换到“插入”标签,最右边找到“符号”,点击,选中“其他符号”。
需要注意的是:使用这种方法去除不需要的字符,处理速度相当慢。当数据量很大的时候,不建议采用此种办法。