这两天重新做 50道练习带你玩转Pandas 然后发现自己好多都不会了,对一些进阶做些小随笔记录下。
(参照 https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.date_range.html)
data_range:用来操作实际日期的很好的函数,主要用于生成一系列特定的时间,我们可以自己设定开始、结束、周期数、时间间隔、时区等等。
函数参数:pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)
参数说明:
- start:str 或类似日期时间,表示日期的起点,默认值为None
- end:str 或类似日期时间,表示日期的终点,默认值为None
- periods:int,生成的周期数。
- freq:string或DateOffset,默认值是’D’,表示以自然日为单位,用于指定计时单位,比如’5H’表示每隔5个小时计算一次。(详细参照 频率别名的列表)
- tz:string或None,返回本地化 DatetimeIndex 的时区名称,例如“Asia/Hong_Kong”。
- normalize:在生成日期范围之前将开始/结束日期标准化为午夜,默认值为False,如果为True的话,那么在产生时间索引值之前会先把start和end都转化为当日的午夜0点。
- name:str,默认值为None,给返回的时间索引指定一个名字。
- closed:{None, ‘left’, ‘right’},默认值为None,表示start和end这个区间端点是否包含在区间内,’left’表示左闭右开区间,’right’表示左开右闭区间,None表示两边都是闭区间。
例:
创建Series s,将2015所有工作日作为随机值的索引:
dti = pd.date_range(start='2015-01-01', end='2015-12-31', freq='B')
s = pd.Series(np.random.rand(len(dti)), index=dti)
s.head(10)