实现ARIMA模型的通用步骤如下:
1) 加载数据:构建模型的第一步当然是加载数据集
2) 预处理:根据数据集定义预处理步骤。包括创建时间戳、日期/时间列转换为d类型、序列单变量化等。
3) 序列平稳化:为了满足假设,应确保序列平稳。这包括检查序列的平稳性和执行所需的转换
4) 确定d值:为了使序列平稳,执行差分操作的次数将确定为d值
5) 创建ACF和PACF图:这是ARIMA实现中最重要的一步。用ACF PACF图来确定ARIMA模型的输入参数
6) 确定p值和q值:从上一步的ACF和PACF图中读取p和q的值
7) 拟合ARIMA模型:利用我们从前面步骤中计算出来的数据和参数值,拟合ARIMA模型
8) 在验证集上进行预测:预测未来的值,
9) 计算RMSE:通过检查RMSE值来检查模型的性能,用验证集上的预测值和实际值检查RMSE值
为什么我们需要Auto ARIMA?
虽然ARIMA是一个非常强大的预测时间序列数据的模型,但是数据准备和参数调整过程是非常耗时的。在实现ARIMA之前,需要使数据保持平稳,并使用前面讨论的ACF和PACF图确定p和q的值。Auto ARIMA让整个任务实现起来非常简单,因为它去除了我们在上一节中提到的步骤3至6。下面是实现AUTO ARIMA应该遵循的步骤:
1) 加载数据:此步骤与ARIMA实现步骤1相同。将数据加载到笔记本中
2) 预处理数据:输入应该是单变量,因此删除其他列
3) 拟合Auto ARIMA:在单变量序列上拟合模型
4) 在验证集上进行预测:在验证集基础上进行预测
5) 计算RMSE:用验证集上的预测值和实际值检查RMSE值