Power Query中数据分割函数详解(1)

Table.SplitColumn(table as table, sourceColumn as text,splitter as function,optional columnNamesOrNumber as anyoptional default as anyoptional extraColumns as any) as table

参数1代表需要操作的表;参数2代表需要分割的文本字段,是一个文本格式;参数3是分割操作的函数,可用的分割函数有9个;参数4是拆分后生成的列数或者字段名称的列表;参数5是用于替换拆分后为空值的值;参数6是展开后的类型,可以为列表。

参数3的操作函数主要有以下几个。

第3参数分析。

1.     Splitter.SplitByNothing

返回不拆分且将其自变量作为单元素列表返回。如果不存在后续参数的话,则需要添加()作为返回,同时不进行拆分,但是会改变原来的字段名称。

例:

Table.SplitColumn(源,"姓名",Splitter.SplitByNothing())=                            

解释:因为是使用了Splitter.SplitByNothing函数参数,所以不做分割处理。

2.     Splitter.SplitTextByAnyDelimiter

Splitter.SplitTextByAnyDelimiter(delimiters as listoptionalquoteStyle as nullableQuoteStyle.TypeoptionalstartAtEnd as nullablelogical) as function

返回以文本列表为任意指定的分隔符将文本拆分文本列表。第1参数是分隔符列表格式;第2参数是对文本类型里csv"的处理,0代表不处理,1代表忽略处理(默认);第3参数是在第2参数为1的时候对起始和结束的判断,是一个逻辑值,默认为false。


例:

Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张"}))=


Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张","三"}))=

解释:因为第2参数使用一个多个分隔符作为列表,所以张,三2个字被处理了。1个分隔符多1列,2个分隔符多2列,所以会显示多2列的字段。


为了方便解说第2参数,我们把数据源改下,改成带"的内容


Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张"},1))=

解释:此时的Splitter.SplitTextByAnyDelimiter参数的第2参数为1,代表忽略处理,也就是认定为是文本字符前缀,结果和不带"效果一样。


Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张"},0))=

解释:此时的Splitter.SplitTextByAnyDelimiter参数的第2参数为0,代表需要进行处理,也就是认定"为文本字符的一部分内容,所以在处理拆分的时候会作为字符来处理。


Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"李"},1,false))=

Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"四"},1,false))=

Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张","李","五"},1,true))=

Table.SplitColumn(源,"姓名",Splitter.SplitTextByAnyDelimiter({"张","李","五"},1,false))=

解释:通过上面几个计算公式,我们可以看到,在处理第一个带"文本的时候如果是false参数,则不会进行分割处理。这里有人会有疑问,最后一个公式第2个李四我只分列一个字,另外一个字呢?实际上这个是因为我们把Table.SplitColumn函数的第4参数给省略了,如果我们加上2的话就是另外的样子了。


3.     Splitter.SplitTextByDelimiter

Splitter.SplitTextByDelimiter(delimiter as textoptionalquoteStyle as nullableQuoteStyle.Type) as function

返回以单个文本为分割字符将文本拆分为文本列表。第1个参数为单个文本作为分割依据的关键词;第2参数是对文本类型里csv"的处理,0代表不处理,1代表忽略处理(默认)。相对于Splitter.SplitTextByAnyDelimiter而言,只设定了一个文本字段来分割。


例:

Table.SplitColumn(源,"姓名",Splitter.SplitTextByDelimiter("张",1),2)=

Table.SplitColumn(源,"姓名",Splitter.SplitTextByDelimiter("李",1),2)=

Table.SplitColumn(源,"姓名",Splitter.SplitTextByDelimiter("张",0),2)=

解释:如果Splitter.SplitTextByDelimiter的第2参数为1则作为csv格式,如果有关键词的话则不会去处理,如果第二参数是0则会处理。


如果有用,动动你的小手进行转发。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容