【转载】PowerQuery中Text.Remove()函数的应用场景

这里看到作者列了用Text.Remove()函数的几个应用场景,简直太妙,忍不住转来整理如下:
去除英文大小写字母
Text.Remove([原始信息],{"A".."z"})

去除英文字符
Text.Remove([原始信息],{" ".."~"})

去除数字
Text.Remove([原始信息],{"0".."9"})

去除中文
Text.Remove([原始信息],{"一".."龥"})

总结
这里的关键是Text.Remove()函数的第二个参数,“removeChars”可以是一个list,而我们知道,list其实可以通过构造序列来生成一个有序list。而原作者举的这些例子, 说明PowerQuery是支持Unicode序列的。如果对Unicode序列非常熟悉的话,可以实现更多情形的特定字符移除。
那么作为文科生,怎么快速去找到Unicode的编码序列表呢?到微软的Office Word中去找。以Word2016为例,切换到“插入”标签,最右边找到“符号”,点击,选中“其他符号”。

这时就出来Unicode的编码表了,可以选择“子集”,然后右边的滚动条可以滚动以查看序列。以下图为例,如果要构造一个当前可视范围的list,则这个list可以写为{"$".."]"}。代入Text.Remove()函数,则下图中所有的字符都将被移除。

需要注意的是:使用这种方法去除不需要的字符,处理速度相当慢。当数据量很大的时候,不建议采用此种办法。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容