时间序列预测&归因分析 2021-12-10

https://cloud.tencent.com/developer/article/1666552

https://cloud.tencent.com/developer/article/1480301?from=article.detail.1666552

https://cloud.tencent.com/developer/article/1631574?from=article.detail.1666552

JS散度
https://zhuanlan.zhihu.com/p/74075915

https://zhuanlan.zhihu.com/p/35709485

不确定性函数 f(x) = -log p(x) ,概率越小,不确定性越大
交叉墒:用来优化不确定性的,预测 和 实际分布之间的不确定性

【Adtributor 算法】
https://blog.csdn.net/Eaton18/article/details/103797563
https://cloud.tencent.com/developer/article/1644348

核心思路:对每个维度,找出真实值和预测值存在巨大差异的几个因素,如果这些因素累加在一其的波动占整体波动很大比例,则认为这几个因素就是造成这次收入波动的根本因素

Adtributor缺点及局限
(1)上述是针对基本类型的KPI的计算公式(例如PV、交易量),对于派生类型的KPI(多个基本类型KPI计算得到,例如成功率)就不太适用了

(2)将根因限定在一维的假设不太符合我们的实际场景,同时用解释性和惊奇性的大小来衡量根因也不完全合理。因为其没有考虑到维度之间的相互影响以及「外部根因」的可能

(3)Adtributor的根因分析严重依赖于整体KPI的变化情况,对于整体变化不大,但是内部波动较为剧烈的数据表现不好

相关论文
Adtributor: Revenue Debugging in Advertising Systems

Recursive Adtributor

iDice: Problem Identification for Emerging Issues
翻译
主要贡献是寻找effective combination

HotSpot: Anomaly Localization for Additive KPIs with Multi-Dimensional Attributes
翻译

Squeeze:Generic and Robust Localization of Multi-Dimensional Root Causes

Bayesian structure learning algorithm

知乎精答
https://www.zhihu.com/question/331456480/answer/806871325

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容