动态参数化的移动平均
如果某事件与最近的一段历史密切相关,虽然每个节点都可能出现扰动,但它们总体的平均状况则能在一定程度上反映这个历史,也预测着随即而来的未来。
在使用Power BI的DAX实现移动平均时,常常面临众多问题,这里有必要将其完整而全面的定义并给出一个计算标准。
概述
移动平均 是 某指标在最近x周期的算术平均值 的简称,涉及到的元素包括:
- 对某个日期跨度为单位周期(如:日,周,月,季);
- 以及周期数 x(如:3,7,10,30等);
- 对于某个指标 k(如:新用户数,活跃用户数等);
计算 指标k 在最近的 x周期 中每个周期的结果并进行算术平均。注意:若不能满足得到最近的x周期,则返回空。
💬 提示
在上述对移动平均的定义中,除了移动平均的计算逻辑被固定,其他部分均可因实际业务需求而变成动态化的需求。
在计算中,需要考虑移动平均计算的开始点以及结束点,不构成 x个 周期数或对于事实表的已迭代完日期都应返回空。
移动平均的意义
移动平均在各类实际业务中都有重要应用,例如股市中的5日线就是5日的移动平均线等。
移动平均是根据最近的历史情况预测下一周期表现的常用方法,关于移动平均,需要知道的包括:
- 移动平均对序列有进行平滑的作用,且期数越多,其平滑作用越强。
- 移动平均反映了序列的趋势。
- 利用移动平均可以追踪趋势。
- 利用移动平均可以判断序列的稳定性。
- 利用移动平均可以判断序列的压力位(平均线的高点)。
- 利用移动平均可以判断序列的支撑位(平均线的低点)。
模型
考虑到通用性,这里采用全参数的做法,即如上图所示,用户可以交互式地指定包括:x坐标轴,度量值,移动平均期数,移动平均单位周期后进行计算。
模型表如下:
- 日期表
- 日期区间表
- 度量值参数表
- 移动平均期数
其中,日期区间表用来动态选择X坐标轴的周期表示,度量值参数表用来动态决定计算哪个度量值,移动平均周期则指出需要平均的周期数。
DAX
在实际编写DAX表达式时,需要针对不同的粒度(日,周,月,季)进行判别后进行处理,实际表达式逻辑类似,但存在冗余。
案例
上述DAX表达式摘自AARRR模型部分内容,结构复杂,不适合教学案例。下面以通用案例提供一个示例文件。
该示例文件可以在此处获取:
链接:https://pan.baidu.com/s/1DQAJZWmQqFRVVSR6Bu3lbg
密码:g1fv