ARIMA模型

1. 白噪声 White Noise

如果一个时间序列是纯随机的,那么它就是白噪声。

可以用\varepsilon_{t} 来表示这种时间序列,它的平均值是0[E(\varepsilon _{t} )=0],方差是常数[V(\varepsilon _{t} )=\sigma ^2],并且是一个不相关的随机变量[E(\varepsilon _{t}\varepsilon _{s})=0]

这种序列的散点图表明不了任何模式,所以不可能预测这种序列未来的值。

2. 自回归模型 AutoRegressive Model (AR)

AR模型中Y_t只跟它过去的值Y_{t-1},Y_{t-2},Y_{t-3}等等有关:

Y_{t}=f(Y_{t-1},Y_{t-2},Y_{t-3},...,\varepsilon _t)

通常来说,和它p个过去的值有关的AR模型叫做AR(p)模型,像这样表示:

Y_{t}=\beta _{0}+\beta _{1}Y_{t-1}+\beta _{2}Y_{t-2}+\beta _{3}Y_{t-3}+...+\beta _pY_{t-p}+\varepsilon _t

比如AR(0)就是Y_t=\beta _0+\varepsilon _t,AR(1)就是Y_t=\beta_0+\beta_1Y_{t-1}+\varepsilon _t

3. 移动平均模型 Moving Average Model (MA)

移动平均模型中Y_t只跟随机误差项有关:

Y_t=f(\varepsilon _t,\varepsilon_{t-1},\varepsilon_{t-2},\varepsilon_{t-3},...)

通常来说,和它q个过去的值有关的MA模型叫做MA(q)模型,像这样表示:

Y_t=\beta_0+\varepsilon_t+\phi _1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}

比如MA(0)就是Y_{t}=\beta_0+\varepsilon_t,MA(1)就是Y_t=\beta_0+\varepsilon_t+\phi_1\varepsilon_{t-1}

误差项\varepsilon _t就是平均值为0,方差是常数\sigma ^2的白噪声。

4. 自回归移动平均模型 AutoRegressive Moving Average Model (ARMA)

这种模型是将AR和MA结合成ARMA(p,q)模型。

ARMA模型与p个自己的过去的值和q个过去的白噪声值有关:

Y_t=\beta_0+\beta_1Y_{t-1}+\beta_2Y_{t-2}+\beta_3Y_{t-3}+...+\beta_pY_{t-p}+\varepsilon_t+\phi_1\varepsilon_{t-1}+\phi_2\varepsilon_{t-2}+\phi_3\varepsilon_{t-3}+...+\phi_q\varepsilon_{t-q}

时间序列的平稳性

严平稳 strictly stationary

如果Y在时间t的边际分布p(Y_t)在任意其他时间点都是相同的话,那么p(Y_t)=p(Y_{t+k}),并且p(Y_t,Y_{t+k})t无关,(这里t\geq  1并且k为任意整数),这样的时间序列被称为严平稳。这意味着Y_t的平均值、方差和协方差都是时不变的 (time invariant)。

弱平稳 weakly stationary

时间序列被称为弱平稳或者协方差平稳如果满足以下条件:

a) E(Y_1)=E(Y_2)=E(Y_3)=...=E(Y_t)=\mu (常数)

b) Var(Y_1)=Var(Y_2)=Var(Y_3)=...=Var(Y_t)=\gamma _0(常数)

c) Cov(Y_1,Y_{1+k})=Cov(Y_2,Y_{2+K})=Cov(Y_3,Y_{3+k})=\gamma _k(和延迟k有关)

5. 自回归整合移动平均模型 AutoRegressive Integrated Moving Average Model (ARIMA)

经过差分后,一个非平稳的时间序列可以变为平稳的时间序列。

一个经过一次差分后变为平稳的时间序列被称为整合了一次,表示为I(1)

一般而言,被经过d次差分后变为平稳的时间序列被称为整合了d次,表示为I(d)

所以,一个没有被经过差分就已经是平稳的时间序列表示为I(0)

博克斯-詹金斯法 Box-Jenkins (B-J) methodology

对于单变量的时间序列模型的估计和预测可以使用博克斯-詹金斯法,主要分为三步:

(1) 识别 (2) 估计 (3) 诊断检测

B-J法只适用于平稳的变量,所以先要转换成平稳的时间序列。

1. 识别 identification

a) 自相关函数 Autocorrelation function (ACF)

自相关就是在一个时间序列中,观测点之间互相有关联。现在的观测点Y_tp个延迟lag之前的观测点Y_{t-p}有一个简单的相关性:

\rho _k=Corr(Y_t,Y_{t-p})=\frac{Cov(Y_t,Y_{t-p})}{\sqrt{var(Y_t)}\sqrt{var(Y_t-p)} }=\frac{\gamma _p}{\gamma _0}

b) 偏自相关函数 Partial Autocorrelation function (PACF)

偏自相关用于测量当Y_tY_{t-p}之间其他的时间延迟1, 2, 3, ..., (p-1)的影响都被去除后的相关性。

c) 从ACF和PACF推断

理论上的ACF和PACF可以从不同的p和q得出,所以,比较不同pq下ACF和理论值,可以得出合适的ARIMA(p,q)模型。

理论上的ACF和PACF的性质如下表:

模型           |    ACF                        |    PACF

AR(p)         |  突刺后衰减趋于0      |  突刺后截止为0

MA(q)         |  突刺后截止为0         |  突刺后衰减趋于0

ARMA(p,q) | 突刺后衰减趋于0      | 突刺后衰减趋于0

2. 估计 estimation

主要借助于各种包进行估算得出p,q值

3. 诊断检测 diagnostic checking

a) 最小的AIC/BIC/SBIC值,这些值为最小的模型最好

b) 残差ACF图

如果残差的大部分自相关系数在-1.96/\sqrt{N}+1.96/\sqrt{N}之间,N为观测点的数量,这样就可以得出残差是白噪声,也就是说模型是合适的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,052评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,267评论 3 397
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,518评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,457评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,474评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,143评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,728评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,650评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,184评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,269评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,415评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,083评论 5 348
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,775评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,257评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,389评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,777评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,419评论 2 359

推荐阅读更多精彩内容

  • 一、基本概念 1.随机时序分析的基本概念1)随机变量:简单的随机现象,如某班一天学生出勤人数,是静态的。2)随机过...
    apricoter阅读 6,533评论 0 10
  • 公式只能传图片?,好多公式都没写上,但是,不管有没有公式,写得一样无趣至极,在中国人民大学出版社出版的王燕编著的<...
    今天芒种阅读 12,659评论 0 10
  • 目录 平稳序列 判断样本的平稳性 时间序列模型 参数选择 实验代码 1. 平稳序列 时间序列是一列观测值的集合, ...
    胡拉哥阅读 11,510评论 0 23
  • 姓名:车文扬 学号:16020199006 转载至:https://blog.csdn.net/qingqing7...
    o錯覺_42a1阅读 9,576评论 0 3
  • 每当我被困难逼迫得心烦气躁的时候,总是习惯性地开始剥坚果。 不是巴旦木那种一下子就容易剥开的果实,而是碧根果那...
    吉甫作诵_穆如清风阅读 513评论 1 2