了解values和distinct
之前的章节,我们学习了all引用一个列的时候,返回包含该列唯一值的表。DAX还另外提供了两个函数,它们也是返回列的唯一值,values和distinct。
在evaluate中,如果没有使用其他筛选条件,values和distinct看起来效果和all一样。但是,当你把它们使用到DAX度量值的时候,你会观察到它们之间一些不同点,因为透视表会提供不同的筛选条件。看下下面的度量值,它们都是计算brand和size列的唯一值。
[Products] := COUNTROWS ( Product )
[Values Brands] := COUNTROWS ( VALUES ( Product[Brand] ) )
[Distinct Brands] := COUNTROWS ( DISTINCT ( Product[Brand] ) )
[Values Sizes] := COUNTROWS ( VALUES ( Product[Size] ) )
[Distinct Sizes] := COUNTROWS ( DISTINCT ( Product[Size] ) )
values()返回所有可见的唯一值,包括了blank。而distinct也是返回唯一值,但是对不匹配的blank值进行了排除。但是如果blank已经包含在自身的列中了,那么结果也会包含blank。所以两者的区别就是blank是否作为了关系的条件。
举个例子来看会更容易理解这个区别,数据按照product的class进行分类,每个类目有不同的产品数。例如Deluxe有360个产品,有11种bland,204种size。values和distinct只有在blank的位置上,存在数字差异。表格也提供了sales amount在检测这个不匹配的产品。
另外一个区别是总计行,brand中,values比distinct多了1.而size,两个函数返回的是相同的数字,原因是size列包含了一个blank,所以这个blank产品没有添加一个新的数字到disinct size列。
当没有筛选条件的时候,distinct相当于allnoblankrow,values相当于all。
values也可以把表作为参数。这情况下,它返回表的左右可见单元格,也包含了空行。例如下面例子,在模型中,sales表和product表存在通过productkey的关系,但是存在无法匹配的product。
[Products] := COUNTROWS ( Product )
[Values Products] := COUNTROWS ( VALUES ( Product ) )
[All NoBlank Products] := COUNTROWS ( ALLNOBLANKROW ( Product
) )
[All Products] := COUNTROWS ( ALL ( Product ) )
这个表可以看出来,当没有筛选条件的时候,values和all结果一样,包含了blank行,显示了没有匹配的行的在Sales Amount。这时候,不能使用distinct。如果有重复行,你没有一种单一的DAX函数来去重重复行(事实上要使用summarize来代替,后面的章节会用到)。另外,度量值product忽略空行,返回了当前表的总行数,结果和allnoblankrow一样。
values函数用于值函数
虽然values是表函数,但是我们通常也可以将它作为值函数来使用,这个是因为DAX有个特性,这小节我们来学习。例如,values按如下表达式使用,当选择的某部分product都是相同的颜色时候,它返回该颜色。
[Color Name] :=
IF (
COUNTROWS ( VALUES ( Product[Color] ) ) = 1,
VALUES ( Product[Color] )
)
通过图示可以看到,当color name列包含空行的时候,它意味着有两种或者以上的不同颜色。
这里有趣的地方是,我们使用values函数作为值函数,虽然它本身返回的是一个表。不仅是values()函数有这样的特点,这个也适用于大部分DAX函数。
如果一个表达式返回的表只有一行一列,那么如果需要的话,系统就会自动的将其转换为一个值。
实际操作中,如果返回的表是一行一列,那么就可以把该表表达式用作值表达式。但是如果返回的表有多行,那么会报一个错误:A table of multiple values was supplied where a single value was expected。所以,你必须要保证,你表达式的结果只能返回一行一列。
Color Name使用了countrows来检测返回的结果是否只有一行,另外一种方法是使用hasonevalue()函数,它同样是检测返回的行数,如果只有返回一行,那么结果是true。下面两个语句有相同的结果:
COUNTROWS ( VALUES ( <column> ) ) = 1
HASONEVALUE ( <column> )
相比countrows,你更应该使用hasonevalue来,首先,它的可读性更好,另外运行速度也更快。下面这样的写法就是基于hasonevalue:
[Color Name] :=
IF (
HASONEVALUE ( Product[Color] ),
VALUES ( Product[Color] )
)
通常是使用values表达式作为值函数是因为,它总是返回一个列以及可能是多个行,这个行数取决于执行的内容。values的使用在很多情况下都会有使用,本书后面会多次采用这样的方法