参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)
第十七章 时间序列分析及预测
预测方法:
- 定性:专家来预测(主观)
- 定量:当被预测变量过去的信息可用,信息可以被量化,过去的模式会持续到未来的假定合理
- 时间序列法(仅依赖于历史资料)
- 因果法(本章不讨论)
通过将时间视为自变量,时间序列视为应变量,回归分析也就可以用于时间序列方法。为了区分,我们表述为截面回归和时间序列回归。
17.1 时间序列的模式
时间序列(time series):是一个变量在连续时间点或连续时期上测量的观测值的序列。测量可以是每小时,每一天等等。
为了确定数据中的基本模式,第一步是绘制时间序列图(horizontal pattern),这个图是时间和时间序列变量之间关系的图形表述。
17.1.1 水平模式
当数据围绕着一个不变的均值上下波动,则存在水平模式。如下图:
平稳时间序列指统计性质是与时间独立的时间序列。含义:
- 过程生产的数据有一个不变的均值;
- 时间序列的变异性随时间的推移保持不变。
经验环境的改变常常导致现有的水平模式的时间序列移动到一个新的水平。如下图,13周开始增加了新的销售合同。
我们不能仅仅通过观测到的水平模式就得出时间序列是平稳的结论。如何确定,可以寻找高级教材来学习。
17.1.2 趋势模式
趋势模式(trend pattern):时间序列呈现随机起伏,但是一段较长的时间内呈现出改变的趋势。
例子1:下图展示某厂近十年自行车销售量的时间序列:
例子2:下图展示公司胆固醇药物获得FDA批准后的销售收入。
17.1.3 季节模式
季节模式(seasonal pattern):指超过一年的周期内,由于季节的影响,时间序列呈现重复模式(俗称各行业每年的淡旺季)。当然小于一年的周期,时间序列也会呈现重复模式,如每天地铁人流量。
举例:5年内雨伞销售量(不仔细看以为水平模式)
17.1.4 趋势与季节模式
有的时间序列同时包含趋势模式和季节模式。
17.1.5 循环模式
如果时间序列图显示出持续时间超过一年的在趋势线上下交替的点序列,则存在循环模式(cyclical pattern),例如经济周期。有时循环影响常常和长期趋势影响合并。
17.1.6 选择预测方法
选择预测方法的流程:
- 绘制时间序列图。
- 通过观察来选择模式。
17.2 预测精度
朴素预测法用上一个时间段的时间序列值作为下一个时间段的预测值。
预测误差=实际值-预测值
如何对预测精度进行度量:
- 预测误差的平均值:5/11=0.45
- 平均绝对误差(mean absolute error)(可以避免正负预测误差相互抵消):MAE==3.73
- 均方误差(mean squared error):MSE==16.27
但是上述的方法依赖于原始数据的测量尺度,如果以月为单位,则数值就会非常大。
- 平均绝对百分数误差(mean absolute percentage error):MAPE=%
调整预测方法,采用过去数值平均数法,即第n周的预测值为n周前的所有时间序列值的平均数。
得到:
- MAE(平均绝对误差)=2.44
- MSE(均方误差)=8.10
- MAPE(平均绝对百分数误差)=12.85%
17.3 移动平均法和指数平滑法
针对水平模式的时间序列的三种预测方法:
- 移动平均法
- 加权移动平均法
- 指数平滑法
17.3.1 移动平均法
移动平均法(moving average):最近k期数据值的平均值,即k阶移动平均预测:
其中,代表时间序列t+1的预测值,代表时间序列t的实际值。
k小能够快速追踪时间序列的移动,k大能有效消除随机波动。
举例,汽油销售数量,取k=3
预测精度:(k=3)
- MAE=
- MSE=
- MAPE%
当k=1时,即朴素预测法,预测精度会下降。我们可以取不同的k来取得当MSE最小时k=6。
17.3.2 加权移动平均法
加权移动平均和移动平均法(每个观测值权重相同)类似,
例如(k=3):
其中权重和要为1。
预测精度:
一般来说越近的数据权重越大,但是当数据波动比较大时可以用移动平均法(即权重相同)。为了给出最好的权重组合,可以使用MSE作为预测精度的测度,然后找到MSE最小的数据值个数和权重组合。
17.3.3 指数平滑法
指数平滑法:是加权移动平均法的一个特例。
指数平滑预测:
其中,代表时间序列t期的实际值,代表时间序列t期的预测值,代表平滑常数。
简单说t+1期的预测值和t期的观测值和预测值的加权平均数。t期实际值的权重为平滑常数。
其中,强行规定,任意预测值都是所有实际值的加权平均值。
预测精度:
经过变换:,
- 当数据波动比较大时,我们倾向于选择较小的平滑常数。
- 当数据波动比较小时,我们倾向于选择较大的平滑常数,因为此时预测误差更可能表示序列水平的改变。
我们需要选择合适的平滑常数来使MSE最小。如和时的汽油销售数量:
通过比较我们选择一个合适的平滑常数。
17.4 趋势推测法
17.4.1 线性趋势回归
下面是自行车销量的时间序列和线性函数的描述:
线性趋势方程:
计算线性趋势的斜率和截距公式:
-
其中为t期的时间序列值(即观测值)
经过下表计算得到,线性趋势方程:
预测精度:
,计算过程如下。
计算机计算更快:
在上图的方差分析(ANOVA)表中,
上面的两个MSE的计算中,分母不一样。前者的MSE是误差平方的平均数。
17.4.2 Holt线性指数平滑
相比之前的指数平滑预测:,Holt线性指数平滑方程需要两个平滑常数和三个方程得到预测。
- 实质是t期观测值和t期的预测值(用t-1期的数据预测)的加权平均数,一般给的值较大
- 观测的斜率(t之下的)占(一般较大)
-
其中的含义 - 是t期时间序列的估计值;
- 是t期时间斜率的估计值;
- 是向前k期的预测值。
- 规定:
- t=1的预测值为t=1的观测值
对自行车销量的时间序列进行Holt线性指数平滑法的计算(表里的预测值都是按照k=1来算的)
可以计算得到,我们可以调整来使得MSE更小。
预测:
17.4.3 非线性趋势回归
举例:胆固醇药物10年的销售收入。
我们看到图展示出了曲线趋势,因此我们使用下面两种曲线。
二次趋势方程:
我们可以把这个看作一般线性模型,有两个变量,通过计算机得到下面的结果。
指数趋势方程:
指数趋势方程可以通过对数变换,然后再铜鼓哦一般的线性模型方法计算。
17.5 季节性和趋势
首先考虑没有趋势的季节性时间序列,再考虑如何模拟有趋势的季节性。
17.5.1 没有趋势的季节性
举例:5年共20个季度的雨伞销售量
前面讲到分类变量中k个处理水平,需要k-1个虚拟变量。对应4个季度需要3个虚拟变量。
通过计算得到:
其中Qtr1为1时代表第一季度,当所有Qtr都为0代表第四季度。
17.5.2 季节性和趋势
举例:4年共16个季度的电视机销售量的时间序列。
模拟电视机时间序列的季节影响和线性趋势的多元回归方程的一般形式:
针对下表的数据计算得到结果:
相当于四条线性回归,同样的斜率不同的截距。
17.5.3 基于月度数据的模型
12个月份需要11个虚拟变量:
17.6 时间序列分解法
时间序列分解可以将时间序列分隔或分解出季节、趋势和不规则成分。常见有加法分解模型和乘法分解模型。
加法分解模型:
适用于季节影响不依赖于时间序列水平的情况。
乘法分解模型:
其中季节和不规则成分相乘按相对量度量,数值大于1则表明它们的影响在趋势之上,数值小于1表明他们的影响在趋势之下。
17.6.1 计算季节指数
我们观察到销售量时间序列存在季节模式,我们先计算移动平均数,目的是提出组合在一起的季节和不规则影响,留下来的只包含趋势和移动平均的随机波动。
这里每个移动平均数选择4项数据,第一个为14;第二个为25以此类推。第一个移动平均数对应季度值是2.5(1、2、3、4的中心为2.5),同理第二个移动平均数对应的季度值是3.5。由于实际上季度不存在小数,所以我们再计算第一个和第二个移动平均数的均值得到中心化移动平均值,此时对应的季度值为3(2.5和3.5的均值)
中心化的移动平均数描绘数据中的趋势(包含没剔除掉的随机波动)
我们通过变换得到季节-不规则值的组合值。即
其中趋势值即为中心化移动平均数,经过计算得到下表:
其中三季度的季节不规则值有3个,我们取其均值作为第三季度的季节影响值=汇总4个季节后得到下表:
取得季节指数后,需要做最后的调整使得季节指数的平均值为1。调整方法:按比例调整。
17.6.2 消除季节影响的时间序列
剔除季节影响的时间序列称为消除季节影响的时间序列,剔除方法:观测值除以对应的季节指数来消除时间序列的季节影响。
剔除后只剩趋势和随机波动。
17.6.3 利用消除季节影响的时间序列确定趋势
为了确定趋势,我们观察图形后使用线性趋势方程来拟合消除季节影响的时间序列。(使用消除季节影响后的数据)
经过计算得到:
目前只有16个季度的数据,但我们可以把时期17代入即可预测。
17.6.4 季节调整
使用消除季节影响的趋势推测值乘以季节指数即可。
即
17.6.5 根据月度数据的模型
要使用12哥约的移动平均数来计算12个月的季节指数。
17.6.6 循环成分
乘法模型可以扩展到包括循环成分:
这里加入了可以表示为趋势的百分比,这里的循环成分归因于时间序列的多年循环(类似季节),时间周期很长,所以要获得足够的数据很困难。一般也很难剔除循环影响。
因此实践中常常合并,称为趋势-循环组合成分
注意:有时月份的天数也会影响,我们可以把一个月的销售额除以天数再成仪30.4167得到月销售的数值。
链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦