一、什么是DAX
DAX是SSAS(sql server as service)和power pivot for excel的编程语言,于2010年发布。
DAX被设计用于计算基于数据模型的业务函数。
二、DAX与SQL的差别
1)SQL中表之间尽管定义了主外键关系,但是查询时必须显式指定join关系。
DAX则不需要指定,表之间的关系是DAX数据模型的一部分,并且这个关系只能是left outer join.
例如:select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales
from sales inner join on Sales.CustomerKey = Customers.CustomerKey
group by Customers.CusTomerName
等价的DAX:
ECALUATE
SUMMARIZE(
Sales,
Customers[CustomerName],
”SumOfSales”,
SUM(Sales[SalesAmount])
)
2) SQL是一种声明式语言,你只需要声明需要什么样的数据集合,而不需要关心引擎是如何获取这些数据。
DAX是一种函数语言。DAX的所有表达式都是函数调用,一个函数的参数也可以是另外一个函数调用。
在SQL中的WHERE对应DAX中的FILTER函数,二者功能类似。(DAX的抽象层次更低一些,更贴近计算过程。)
例如:
select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales
from sales inner join on Sales.CustomerKey = Customers.CustomerKey
where Customers.Continent = ‘Europe'
group by Customers.CusTomerName
等价的DAX:
ECALUATE
SUMMARIZE(
FILTER(Customers,Customers[Continent] = “Europe"),
Customers[CustomerName],
”SumOfSales”,
SUM(Sales[SalesAmount])
)
3)SQL语言中,对查询语言和编程语言有清晰的区分。例如存储过程就是作为基于SQL的一种编程语言。但是DAX并不区分编程语言和查询语言,它只是一个丰富的函数集合,操作物理表然后输出物理表。因此DAX比SQL要更简单一些。
4)SQL中的子查询是一种非常强大的功能,DAX也有类似机制,而且比SQL表达跟自然和简洁。
例如:
select * from
(
select Customers.CustomerName,sum(Sales.SalesAmount) as SumOfSales
from sales inner join on Sales.CustomerKey = Customers.CustomerKey
where Customers.Continent = ‘Europe'
group by Customers.CusTomerName
)
where SumOfSales > 100
等价的DAX:
EVALULATE
FILTER(
SUMMARIZE(
FILTER(Customers,Customers[Continent] = “Europe"),
Customers[CustomerName],
”SumOfSales”,
SUM(Sales[SalesAmount])
),
[SumOfSales] > 100
)
三、DAX基本语法
3.1 DAX的数据类型:
实际开发中,可能并不需要太关注这些类型,因为DAX支持隐式转换,而且比一般的SQL隐式转换强大。例如 Sales[Order Date]+7 这种在SQL中是一定要用函数实现的,但是DAX可以识别为是Order Date字段日期往后加7天。
例1: = 5 & 4
例2: = ”5“ + ”4“
虽然DAX的隐式转换很强大,但是跟SQL一样,通常不建议在可以明确的场景下依赖隐式转换,因为可能会导致不符合预期的转换错误。
3.2 DAX的操作符
3.3 计算字段与度量
在DAX中,计算字段是一个字段表达式,表达单行计算的语义。而度量也是一个字段表达式,但是表达的是行间汇总计算的语义。
例1: sales[SalesAmount] - sales[TotalProductCost] 是一个计算字段
例2: sum(sales[SalesAmount]) - sum(sales[TotalProductCost] ) 是一个度量
四、DAX常用函数
函数分类:
五、DAX表达式
DAX的表达式分为两类:scalar expression 和 table expression
所谓scalar expression, 一般只返回一个String或number类型的单值。
例如: = 4+3
= sum(Sales[Quantity])
= countrows(Filter(sales,sales[unit price]))
而table expression则输出的是一个二维表。
例如: = Filter(sales,sales[unit price])
DAX的语法全集是
[ DEFINE { MEASURE <tableName>[<name>] = <expression>} ]
EVALUATE <table>
[ ORDER BY { <expression> [ { ASC | DESC } ] } [ , …]
[START AT {<value>|<parameter>} [,…]]
]
六、计算上下文
filter context: 可以理解为是一组表,每张表只有一列,该列包含该列可以显示的值。
一个filter是某一列上的一组值。
一个filter总是只作用于单一列。
七、常用函数
values :
[NumOfCustomers] = COUNTROWS( VALUES( Sales[CustomerKey] ) )
HASONEVALUE :
检测是否表达式只返回一个值
例:[ScaledSalesAmount] := IF ( HASONEVALUE ( Scala[ DivideBy] ),
DIVIDE ( [ Sales Amount ] , VALUES ( Scale[ DivideBy ] )),
[ Sales Amount ]
)
CALCULATE:
[ Measure ] := CALCULATE ( Expression, Condition1 , Condition2 ,…)
本函数是唯一可以修改filter context的函数。
它接收两类条件输入,一类是值列表(table expression),一类是布尔表达式。
实际上第二类也会被转化为第一类。
例如:
会被转化为:
案例:
目标表格
错误的写法和结果:
正确的写法:
案例2:
结果:
如果Filter中加ALL,是不是跟CALCULATE表达式等价呢?
结果是:
并不等价,因为ALL会把外部的所有列的过滤条件都清除了。
这就需要另外一个函数,CALCULATETABLE。
CALCULATETABLE与CALCULATE的差别在于返回值,前者返回table,后者返回单元格。
结果是:
简化的写法:
CALCULATE函数的Context转换
我们知道CALCULATE函数可以接收外部的row context,这是一个非常有用的特性。例如:
可以看到CALCULATE函数过滤了Product name,而单纯的sum函数始终输出的是总和。
原理是,CALCULATE函数可以把外部的row context转化为等价的filter context,然后作用于内部计算。
如果是measure则计算时会自动加上CALCULATE,行为跟显式加CALCULATE是一致的。
例如下面两种写法是等价的: