1.什么是时间序列数据?
时间序列数据就是一系列数据,这些数据点,每一个都被分配了一个时间戳。
一个简单的例子就是给定日期不同时间点的股票价格,或者某个地区的不同月份的降雨量。
2.时间序列分析的不同组成部分
1.trend:显示数据随时间或数据频率的变化。是增长还是衰退。
2.Seasonality:用于发现间隔均匀的时间内发生的变化。
3.Irregularity:时间序列数据的波动与趋势或季节性不对应。您的时间序列中的这些变化纯粹是随机的,通常是由不可预见的情况引起的,例如自然灾害导致人口突然减少。
4.Cyclic:时间序列中持续一年以上的振荡称为循环。它们可能是周期性的,也可能不是周期性的。
5.Stationary:随着时间的推移具有相同统计特性的时间序列是平稳的。平稳序列具有恒定的均值、方差和协方差。
时间序列的一个聚类例子是:气候聚类。
数据结构是:属性是不同的城市,索引是年月日,属性下的值都是降雨量。
目标是把降雨量相似的城市聚类。