基于daily模式的分类模型,预测日前电价
针对问题:电价中不同模式显示出不同映射关系,电价单变量预测误差大。
提出模型:基于每日模式预测(daily pattern prediction,DPP)的日前电价预测分类方法。1.从常规预测方法提供的“粗略”日前预测结果中识别出第二天的价格模式,2.执行分类建模,为每个模式建立特定的预测模型来进一步提高预测准确性。
算法步骤:1.K均值将历史每日电价曲线分簇,为每个每日曲线分配一个模式标签,用于训练每日模式识别(DPR)模型和分类建模。2.提出一种DPP模型来从多种常规预测方法提供的预测结果中识别第二天的价格模式。此步骤中提出一种加权投票机制(WVM)方法,以结合多个日前模式预测,以获得更准确的DPP结果。3.根据步骤1中的聚类结果建立每个不同日模式的分类预测模型。4.检查DPP结果的可信度,最终确定是否可以采用建议的分类DAEPF建模方法。
本文贡献:(1)揭示了统一建模的错误产生机理和分类建模的优越性。仅适合历史数据和未来数据之间单个映射关系的统一建模通常会产生较大的误差,因为电价数据中不同的波动模式显示出不同的映射关系。分类建模为每个不同的模式建立一个模型,以便更好地分别拟合多个映射关系。
(2)提出了基于每日模式预测(DPP)的DAEPF分类建模方法。基本思想是,首先从常规预测方法提供的“粗略”日前预测结果中识别出第二天的价格模式,然后执行分类建模以进一步提高预测准确性。
(3)在价格模式预测的步骤中提出了一种加权投票机制(WVM)方法,将多个日前模式预测组合在一起以获得更准确的模式预测结果。
在第一方面(预测问题的表达),有两种不同的建模方法:统一建模和分类建模。统一建模直接使用历史数据来预测未来数据,并且仅建立一个单一的预测模型而无需分类。分类建模首先根据每日波动模式将历史数据划分为几个聚类,然后为每个聚类建立预测模型[34]。分类建模通常要优于统一建模。原因说明如下。大多数预测方法通常将所有数据分为两个子集:训练集和测试集。对于某种预测方法,预测精度主要取决于训练集和测试集之间的映射关系是否紧密。如果测试集中的输入和输出之间的映射关系与训练集中的输入和输出之间的映射关系不同,则会发生较大的错误。每日电价数据有几种不同的波动模式,这意味着历史数据和未来数据之间必须存在不同的映射关系。分类建模将具有不同波动模式的所有历史数据分组到不同的群集中,并为每个群集建立一个模型。因此,同一集群中输入和输出之间的映射关系是紧密的,分类建模可以提供更准确的预测结果。
1.K-MEANS将历史数据分成n簇,为每个历史日标记一个模式标签,标签作为step2.2模式识别模型的输出。
2.预测第二天的模式标签:2.1.选择m种预测模型,用前三天电价预测第二天,得到“粗糙的”预测结果。2.2.重新认识第二天的每日价格模式。 用支持向量分类(SVC)建立日常模式识别(DPR)模型。由于计算复杂度高,(最高价格,最低价格,平均价格,价格差异,最高价格与最低价格之间的差异以及平均价格波动)作为DPR模型的输入,输出是其属于对应群集的每日模式。 用此DPR模型来识别步骤2.1中m个不同的DAEPF模型提供的“粗糙” DAEPF结果的每日价格模式,获得m个不同的第二天的DPP结果。2.3.加权投票。2.3中的结果(m维)一起获得第二天的最终DPP结果(1维)。 WVM的基本思想是,表现出更好性能的单独模型应分配更大的权重系数。
3.为n个簇建立n个预测模型。对于每个簇,用同一集群中的历史每日电价数据来训练分类模型。 将前三天的电价数据作为预测模型的输入,将第二天的电价作为预测模型的输出。 然后根据DPP结果选择相应的模型以产生最终的预测结果。 此步骤使用2.1中采用的相同的五种预测方法,以便在建议的分类模型和统一模型之间进行合理的比较。
4.可信度检查,确定是否可以使用针对某种模式的建议分类DAEPF建模方法。 如果某个模式的最终DPP结果显示出较高的可信度,则接受在3中选择的分类DAEPF模型来预测第二天的电价。 否则,将2.1的“粗略”预测作为最终预测结果。
预测模型:ARIMA, RBF neural network, support vector regression (SVR), Elman neural network and extreme learning machine (ELM)
模式识别模型:SVC
权重机制:WVM
度量指标:平均绝对百分比误差(MAPE),均方根误差(RMSE)和误差标准偏差(SDE)。