一、日期和时间数据类型
在数据分析中,将与时间变化的数据单独作为一种数据类型,称为时间序列数据。时间分析包括两个基本问题
- 对时间序列的描述,也就是这段时间内发生了什么。
- 利用前面的结果进行描述,预测接下来发生什么。
这也是时间序列分析最重要的作用,随着时间对于一些事物进行预测是基本人类活动。
生活中的时间数据很多
用于时间序列分析的包:TimeSeries
时间序列的数据类型简称是ts
日期的数据类型简称是Date
1.将字符串数据类型转换为日期类型
as.Date函数用于将字符串类型转化为日期类型。format指定输出格式,%Y指四位数的年份,%y则指两位数的年份;同理,%m指两位数月份,%d指两位数日期。关于format中字母的含义可以通过?strftime查看对应的含义。
a<-"2017-01-01"
as.Date(a,format="%Y-%m-%d") #将字符串a转换成日期类型并输出
##class(as.Date(a,format="%Y-%m-%d") ) #可用于知晓数据类型
2.seq函数创建连续日期点
seq函数和as.Date函数结合使用,可以产生日期序列,这使得函数可以一次性的产生一连串正确的日期序列,避免了2月30日这种错误格式的出现
3.ts函数创建连续时间序列
ts函数用于生成连续时间序列,start是起始点,end是终止点,frequency值是指一年内采集几次数据,frequency=1指每年采集一次数据,frequency=4指每季度采集一次数据,frequency=12指每月采集一次数据。
sales<-round(runif(48,min=50,max=100))
ts(sales,start=c(2010,5),end=c(2014,4),frequency=12)
ts(sales,start=c(2010,5),end=c(2014,4),frequency=4)
ts(sales,start=c(2010,5),end=c(2014,4),frequency=1)