天猫双十一成交额是如何预测的

首发于公众号:可乐的数据分析之路

2020年淘宝双十一成交额4982亿,要知道2019年是2684亿,猛地一瞅,好牛,但总量越来越大的同时增长率却逐年降低呀,且今年的统计口径和历年都不一样(后面会说统计口径的问题)。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

其实早在2019年双十一前,网友们就开始讨论双十一数据造假的问题了,有网友对历年数据进行拟合并且成功预测19年的成交额,结果都高度吻合。


image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

今天我们主要是借着双十一成交额这个数据来聊一聊时间序列分析的问题

时间序列,顾名思义,就是数据随时间变化

时间序列进行预测的关键,是确定已有时间序列的变化模式,并假定这种模式会延续到未来

名词解释

时间序列:数据随时间变化的形式

经济数据大多呈时间序列的形式,如历年淘宝双十一成交额

一个时间序列的变化通常可以由以下4种成分组成:

  • 趋势:时间序列呈现的某种持续上升/下降的变化。趋势可以是线性的,也可以是非线性的。

想要确定一个时间序列是否包含趋势成分,可对数据进行回归分析,得到拟合的趋势线,并进行显著性检验,通过检验,则说明线性趋势显著

  • 季节性:时间序列在一年中出现的周期性波动就是季节性。

想要确定一个时间序列是否包含季节性的成分,需要至少两年的数据,

  • 周期性:时间序列中呈现的围绕长期趋势的波浪或振荡式变动,周期性通常由经济环境的变化引起。
  • 随机性:除了趋势、季节性、周期性变动以外的某种随机的变动

做时间序列分析最关键的就是一个假设,假设现在的这种变化趋势会延续到未来

下面介绍几种时间序列预测的方法

平滑预测法

只含有随机成分,不存在趋势或季节性成分的可用该方法,平滑预测法包含简单平均法、移动平均法、指数平滑法,通过平滑就可以消除随机波动

简单平均法

以一定观察期的数据求得平均数,并以所求平均数为基础,预测未来时期的预测值。简易平均法是最简单的定量预测方法

如下图用简单平均法预测2020年淘宝双十一交易额

因为近期的数值远比远期的数值更有作用,因此这样预测的结果是不够准确的。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

移动平均法

移动平均法就是利用近期的数据来预测未来的方法,也可以细分成两种方法,简单移动平均法和加权移动平均法。

简单移动平均法是将最近期的数据平均后最为下一期的预测值

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

可以用Excel来做
进入路径:数据——数据分析——移动平均
输入:输入数据源
间隔:指定使用几组数据来得出平均值,即公式中的n,移动个数。
输出:确定输出区域以及图表

还是双十一数据,可以取间隔为3和2时分别计算一下看看。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

需要注意的是:

  • 移动平均的项数不宜过大
  • 加大移动平均法的期数(即加大n值)会使平滑波动效果更好,但会使预测值对数据实际变动更不敏感
  • 移动平均法要由大量的过去数据的记录

指数平滑法

指数平滑法是对观察值进行加权从而进行预测的一种方法,通过对不同时间的观察值所赋予的权数不等,从而加大了近期观察值的权数,使预测值能够迅速反映市场实际的变化。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

Excel里也有指数平滑的方法
路径:数据——数据分析——指数平滑,注意这里填的是阻尼系数


image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

趋势序列预测

当序列存在明显的趋势时,就不再适用上述方法了,应用趋势序列预测的方法。

线性趋势

呈现出增长/下降的线性变化趋势,有点回归分析那味儿了,可以用Excel里的趋势线来预测,选择线性趋势,勾上显示公式和R平方,代入线性公式,得到2020预测值。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

非线性趋势

其实这个淘宝双十一的数据我们很明显地看出来它是呈指数递增的,那就在趋势线里选择指数,得到指数曲线的预测方程,代入公式预测2020年数据,可以看到误差还是挺大的。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

可以用二项式来预测,可以看到R方为0.9996,说明拟合效果不错,比线性和指数都要好,把公式代入得到2020年预测值为3280,阿里官方的统计口径是11.1日至11月11日0.30分累积3723亿,最终的成交金额为4982亿。

这里有个统计口径的问题,之前几年的数据都是当天的成交额,而2020年则变成了11月1日~11日的累积成交额,再结合增长率看看,说明什么呢?大家心知肚明就好了哈。

image

<figcaption style="line-height: inherit; margin: 0px; padding: 0px; margin-top: 10px; text-align: center; color: rgb(153, 153, 153); font-size: 0.7em;"></figcaption>

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容