1. 说明
Prophet是FaceBook开源的时序框架。非常简单实用,你不需要理解复杂的公式,看图,调参,调用十几行代码即可完成从数据输入到分析的全部工作,可谓懒人之利器。
在效果方面,我在同一项目中尝试了ARIMA,将星期和节假日作为特征代入GBDT,Prophet,相对来说,Prophet效果最好,当然这与数据有关,也不能一概而论。总之,Prophet效果挺好的,训练速度也挺快。
Prophet的原理是分析各种时间序列特征:周期性、趋势性、节假日效应,以及部分异常值。在趋势方面,它支持加入变化点,实现分段线性拟合。在周期方面,它使用傅里叶级数(Fourier series)来建立周期模型(sin+cos),在节假和突发事件方面,用户可以通过表的方式指定节假日,及其前后相关的N天。可将Prophet视为一种针对时序的集成解决方案。
使用Prophet具体使用步骤就是:根据格式要求填入训练数据,节假日数据,指定要预测的时段,然后训练即可。除了预测具体数值,Prophet还将预测结果拆分成trend, year, season, week等成份,并提供了各成份预测区间的上下边界。不仅是预测工具,也是一个很好的统计分析工具。
当然Prophet也有它的弱项,比如可调节的参数不多,不支持与其时序特征结合等等,不过这些也可以通过预测处理和模型融合来解决。
2. 安装
在Ubuntu系统中可通过以下命令安装prophet:
$ sudo pip install fbprophet
通过以下命令下载源码(下面例程中用到了源码中的数据,请先下载源码)
$ git clone https://github.com/facebookincubator/prophet.git
3. 例程
具体使用可参考源码的notebook目录中的例程,很多中文例程都使用了其中的quick_start.ipynb,代码在下面列出。
import pandas as pd
import numpy as np
from fbprophet import Prophet
import matplotlib.pyplot as plt
# 读取时间数据文件,文件也在源码目录中
file_path= 'examples/example_wp_peyton_manning.csv'
df = pd.read_csv(file_path)
# 输入节假日数据,注意lower_window, upper_window是前后影响天数
playoffs = pd.DataFrame({
'holiday': 'playoff',
'ds': pd.to_datetime(['2008-01-13', '2009-01-03', '2010-01-16',
'2010-01-24', '2010-02-07', '2011-01-08',
'2013-01-12', '2014-01-12', '2014-01-19',
'2014-02-02', '2015-01-11', '2016-01-17',
'2016-01-24', '2016-02-07']),
'lower_window': 0,
'upper_window': 1,
})
superbowls = pd.DataFrame({
'holiday': 'superbowl',
'ds': pd.to_datetime(['2010-02-07', '2014-02-02', '2016-02-07']),
'lower_window': 0,
'upper_window': 1,
})
holidays = pd.concat((playoffs, superbowls))
# 训练和预测
prophet = Prophet()
df['y'] = np.log(df['y'])
prophet.fit(df)
future = prophet.make_future_dataframe(freq='D',periods=10) # 测试之后十天
forecasts = prophet.predict(future)
# 训练结果作图
prophet.plot(forecasts).show()
prophet.plot_components(forecasts).show()
plt.show()
趋势,周期分析图