第1章 什么是DAX?
1.1 理解数据模型
1.2 DAX FOR EXCEL用户
1.3 DAX for SQL开发人员
1.4 DAX for MDX开发人员
1.5 DAX FOR POWER BI 用户
DAX for SQL开发人员
如果您习惯使用SQL语言,那么您已经使用了许多表并在列之间创建了联接以设置关系。从这个角度来看,您可能会在DAX世界中感到宾至如归。实际上,在DAX中进行计算只是查询一组由关系连接在一起的表并汇总值。
关系处理
SQL和DAX之间的第一个区别是关系在模型中的工作方式。在SQL中,我们可以在表之间设置外键来声明关系,但是除非明确说明,否则引擎永远不会在查询中使用这些外键。例如,如果我们有一个Customers表和Sales表,其中CustomerKey是Customers表的主键的Sales表的外键,我们可以写出下面的查询:
SELECT
Customers.CustomerName,
SUM ( Sales.SalesAmount ) AS SumOfSales
FROM
Sales
INNER JOIN Customers
ON Sales.CustomerKey =
Customers.CustomerKey
GROUP BY
Customers.CustomerName
尽管我们在模型中使用外键声明了关系,但仍然需要在查询条件中明确声明连接状态。尽管这种方法使查询更加冗长,但是它很有用,因为您可以在不同的查询中使用不同的联接条件,从而在表达查询的方式上具有很大的自由度。
在DAX中,关系是模型的一部分,并且它们都是LEFT OUTER JOINs。在模型中定义它们时,您不再需要在查询中指定联接类型:每当您使用与主表相关的列时,DAX都会在查询中自动使用LEFT OUTER JOIN。因此,在DAX中,您将按以下方式编写先前的SQL查询:
EVALUATE
SUMMARIZECOLUMNS (
Customers[CustomerName],
"SumOfSales", SUM ( Sales[SalesAmount] )
)
因为DAX知道Sales和Customer之间的现有关系,所以它会按照模型自动进行联接。最后,SUMMARIZECOLUMNS函数需要按Customers [CustomerName]进行分组,但是我们没有关键字:SUMMARIZECOLUMNS自动按选定的列对数据进行分组。
DAX是一种功能语言
SQL是一种声明性语言。您可以通过声明要使用SELECT检索的数据集来定义所需的内容语句,而不必担心引擎实际上如何检索信息。
另一方面,DAX是一种功能语言。在DAX中,每个表达式都是一个函数调用。函数参数又可以是其他函数调用。参数的评估可能会导致DAX执行复杂的查询以计算结果。
例如,如果我们只想检索居住在欧洲的客户,则可以使用SQL编写此查询:
SELECT
Customers.CustomerName,
SUM ( Sales.SalesAmount ) AS SumOfSales
FROM
Sales
INNER JOIN Customers
ON Sales.CustomerKey =
Customers.CustomerKey
WHERE
Customers.Continent = 'Europe'
GROUP BY
Customers.CustomerName
使用DAX,我们不会在查询中声明WHERE条件。相反,我们使用特定的函数(FILTER)来过滤结果:
您会看到FILTER是一个函数:它仅返回居住在欧洲的客户,从而产生预期的结果。我们嵌套函数的顺序和所使用函数的种类对结果和引擎的性能都有很大的影响。这也发生在SQL中,尽管在SQL中我们相信查询优化器会找到最佳查询方案。在DAX中,尽管查询优化器做得很好,但作为程序员,您在编写优质代码方面承担了更多责任。
DAX作为一种编程和查询语言
在SQL中,查询语言和编程语言(即用于在数据库中创建存储过程、视图和其他代码段的指令集)之间存在明显的区别。每个SQL语言都有其自己的语句,可让程序员使用代码丰富数据模型。但是,DAX实际上在查询和编程之间没有区别。丰富的函数集可以操纵表,并可以依次返回表。上一个查询中的FILTER函数就是一个很好的例子。
在这方面,似乎DAX比SQL更简单。当您将它作为一种编程语言(最初使用)学习时,您将知道将其也用作查询语言所需的一切。
DAX和SQL中的子查询和条件
作为查询语言,SQL最强大的功能之一就是可以使用子查询。DAX具有类似的概念。但是,对于DAX子查询,它们源自语言的功能性质。
例如,要检索专门针对购买了价值超过100美元的客户的客户和总销售额,我们可以在SQL中编写以下查询:
SELECT
CustomerName,
SumOfSales
FROM (
SELECT
Customers.CustomerName,
SUM ( Sales.SalesAmount ) AS SumOfSales
FROM
Sales
INNER JOIN Customers
ON Sales.CustomerKey =
Customers.CustomerKey
GROUP BY
Customers.CustomerName
) AS SubQuery
WHERE
SubQuery.SumOfSales > 100
通过嵌套函数调用,我们可以在DAX中获得相同的结果:
EVALUATE
FILTER (
SUMMARIZECOLUMNS (
Customers[CustomerName],
"SumOfSales", SUM ( Sales[SalesAmount]
)
),
[SumOfSales] > 100
)
在此代码中,先检索CustomerName和SumOfSales的子查询再输入到FILTER函数中,FILTER函数仅保留SumOfSales大于100 的行。现在,此代码对您来说似乎不可读。但是,一旦您开始学习DAX,就会发现使用子查询比在SQL中容易得多,并且由于DAX是一种功能性语言,它自然会流行。