Power BI组成:
Power Query、Power Pivot、Power View、Power Map
一、数据处理的3个过程:数据获取、数据整理、数据丰富
1.数据获取
2.数据整理(数据清洗)
a.提升标题
b.更改数据类型
c.删除错误(error)/空值(null)
d.删除重复项
e.填充
f.合并列
g.拆分列
h.分组
i.提取
j.行列转置(注意把标题降下来)
k.行列操作
l.逆透视列(二维表转一维表,宽表降维)
m.透视列(数据透视,增加维度)
3.数据丰富
a.添加列:添加重复列、添加索引列、添加条件列、添加自定义列
b.追加查询(在下面添加新的行数据,纵向合并)
c.合并查询(横向合并数据)
二、M函数
1.M 函数基本规范
M 函数对大小写敏感,第一个字母都是大写
表被称为 Table,每行的内容是一个 Record,每列的内容是一个 List
行标用大括号{ },比如取第一行的内容:=表{0} //PQ 的第一行从 0 开始
列标用中括号[ ],比如取自定义列的内容:=表[自定义]
取第一行自定义列的内容:=表{0}[自定义
2.常用的 M 函数
• 聚合函数:
求和:List.Sum()
求最小值:List.Min()
求最大值:List.Max()
求平均值:List.Average()
• 文本函数:
求文本长度:Text.Length()
去文本空格:Text.Trim()
取前 n 个字符:Text.Start(文本,n)
取后 n 个字符:Text.End(文本,n)
• 提取数据函数:
从 Excel 表中提取数据:Excel.Workbook()
从 Csv/Txt 中提取数据:Csv.Document()
• 条件函数:
if else then (相当于 Excel 中的 IF)
在公式标记栏中输入#shared,就把所有的 M 函数显示出来
三、数据建模 度量值&DAX函数
1.DAX 参数的基本格式 :
表名用单引号' '括着 // '日期表'
字段用中括号[ ]括着 //[日期]
度量值也是用中括号[ ]
引用字段始终要包含表名,以和度量值区分开
2. DAX 常用函数
聚合函数:SUM ,AVERAGE ,MIN ,MAX ,COUNT(计数) ,COUNTROWS(计算行数),DISTINCTCOUNT(计算不重复值个数)
(迭代函数:SUMX,AVERAGEX, MINX, MAXX, RANKX)
时间智能函数:
PREVIOUSYEAR/Q/M/D:上一年/季/月/日
NEXTYEAR/Q/M/D:下一年/季/月/日
TOTALYTD/QTD/MTD:年/季/月初至今
SAMEPERIODLASTYEAR:上年同期
PARALLELPERIOD:上一期
DATESINPERIOD:指定期间的日期
筛选函数(DAX查询函数):
FILTER:筛选
ALL:所有值,可以清除筛选
ALLEXCEPT:保留指定列
VALUES:返回不重复值
3.CALCULATE的语法结构
语法:CALCULATE(<expression>,<filter1>,<filter2>…)
a.第一个参数是计算表达式,可以执行各种聚合运算
b.第二个参数开始,是一系列筛选条件,可以为空;如果多个筛选条件,用逗号分隔
c.所有筛选条件的交集形成最终的筛选数据集合
d.根据筛选出的数据集合执行第一个参数的聚合运算并返回运算结果
4.FILTER函数语法结构
FILTER(<table>,<filter>)
a.第一个参数<table>是要筛选的表
b.第二个参数<filter>是筛选条件
c.函数返回结果是一张表,不能单独使用,需要与其他函数结合使用
5.HASONEVALUE(<columnName>)
参数只有:列名 作用:判断外部上下文中是否为该列中的唯一值,做切片器交互时比较有用
6.SUMX(<table>,<expression>)
第一个参数为被运算的表table,第二个参数是对表中的每一行计算的表达式
7.EARLIER函数
EARLIER语法(<column>,<number>)
a.第一个参数是列名
b.第二个参数一般可以省略
c.EARLIER函数提取本行对应的该列的值,实际上就是提取本行和参数行列交叉的单元格
四、可视化制作
1.柱形图
a.堆积柱形图
不同序列显示在一根柱子上,可以直接比较总量大小,分类序列的数值比较功能弱化
b.簇状柱形图
不同序列使用不同的柱子,可以比较各序列的数值大小,总量比较功能弱化
c.百分比堆积柱形图
不同序列在一根柱子显示,明显对比各序列的相对大小,Y轴标签变为百分比,无法比较总量,每根柱子一样高
2.矩形树状图
使用场景:
a. 要显示大量的分层数据( 条形图不能有效地处理大量值)
b. 要显示每个部分与整体之间的比例
c. 要显示层次结构中指标在各个类别层次的分布的模式
d. 要使用大小和颜色编码显示属性
e. 要发现模式、离群值、最重要因素和异常
3.地图
气泡地图 Bubble Map
着色地图 Filled Map
ArcGIS Map