从第一份工作到现在已经6年多了,一直在从事数据相关工作,回顾工作内容发现,虽然预测很难理想化,但是始终是决策层希望得到的参考信息。下面带你快速了解预测模型:
一、基本步骤
从统计模型出发作预测一般需要4个大的步骤,需求确认、数据收集与整理、模型构建、模型评价与确认,如下图;如果涉及机器学习算法,还需要反复调优;后续文章再介绍;
二、常见预测模型
任何一门学科都在不停的进步,算法的种类也越来越多,每种算法都有自己的优劣势,下图展示了用于预测的几种常见算法。其实,在做项目时,最重要的是挑选合适的算法,而不是纠结于算法的难易程度;
我们必须根据数据分布特点、数据量、预测周期来挑选合适的算法,下图是关于不同算法的应用对比:
三、模型的效果评估
一种预测方法的好坏取决于预测误差的大小,较为常见的是采用均方误差比较各种方法的优劣,均方误差越小,模型预测效果越好。
均方误差是各数据偏离真实值差值的平方和的平均数,用MSE表示,计算公式为: