利用Python进行数据分析(7)-时区处理

contents

image

时区处理

很多时间用户选择世界协调时间或者UTC,它是格林治时间的后继者,目前的国家标准。时区通常表示为UTC的偏置。

Python语言中,时区信息通常是来自于第三库pytzpandas中封装了pytz的功能

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 获取时区名称
import pytz
pytz.common_timezones[-5:]   
['US/Eastern', 'US/Hawaii', 'US/Mountain', 'US/Pacific', 'UTC']
# 获取pytz对象,使用pytz-timezone
tz = pytz.timezone('America/New_York')
tz
<DstTzInfo 'America/New_York' LMT-1 day, 19:04:00 STD>

时区集合生成

rng = pd.date_range('5/10/2020 11:30'
                    ,periods=6
                   ,freq='D')
ts = pd.Series(np.random.randn(len(rng))
              ,index=rng)
ts
2020-05-10 11:30:00    1.072220
2020-05-11 11:30:00    2.088327
2020-05-12 11:30:00   -0.795575
2020-05-13 11:30:00    1.230427
2020-05-14 11:30:00   -0.012184
2020-05-15 11:30:00   -0.786641
Freq: D, dtype: float64
ts.index
DatetimeIndex(['2020-05-10 11:30:00', '2020-05-11 11:30:00',
               '2020-05-12 11:30:00', '2020-05-13 11:30:00',
               '2020-05-14 11:30:00', '2020-05-15 11:30:00'],
              dtype='datetime64[ns]', freq='D')
print(ts.index.tz)  # tz属性为None
None
# 时区集合生成
pd.date_range('5/10/2020',periods=10,freq='D',tz='UTC')
DatetimeIndex(['2020-05-10 00:00:00+00:00', '2020-05-11 00:00:00+00:00',
               '2020-05-12 00:00:00+00:00', '2020-05-13 00:00:00+00:00',
               '2020-05-14 00:00:00+00:00', '2020-05-15 00:00:00+00:00',
               '2020-05-16 00:00:00+00:00', '2020-05-17 00:00:00+00:00',
               '2020-05-18 00:00:00+00:00', '2020-05-19 00:00:00+00:00'],
              dtype='datetime64[ns, UTC]', freq='D')

简单时区转换到本地化:tz_localize

ts
2020-05-10 11:30:00    1.072220
2020-05-11 11:30:00    2.088327
2020-05-12 11:30:00   -0.795575
2020-05-13 11:30:00    1.230427
2020-05-14 11:30:00   -0.012184
2020-05-15 11:30:00   -0.786641
Freq: D, dtype: float64
ts_utc=ts.tz_localize('UTC')
ts_utc
2020-05-10 11:30:00+00:00    1.072220
2020-05-11 11:30:00+00:00    2.088327
2020-05-12 11:30:00+00:00   -0.795575
2020-05-13 11:30:00+00:00    1.230427
2020-05-14 11:30:00+00:00   -0.012184
2020-05-15 11:30:00+00:00   -0.786641
Freq: D, dtype: float64
ts_utc.index
DatetimeIndex(['2020-05-10 11:30:00+00:00', '2020-05-11 11:30:00+00:00',
               '2020-05-12 11:30:00+00:00', '2020-05-13 11:30:00+00:00',
               '2020-05-14 11:30:00+00:00', '2020-05-15 11:30:00+00:00'],
              dtype='datetime64[ns, UTC]', freq='D')

转换到其他时区:tz_convert

ts_utc.tz_convert("America/New_York")   # 转到纽约时区
2020-05-10 07:30:00-04:00    1.072220
2020-05-11 07:30:00-04:00    2.088327
2020-05-12 07:30:00-04:00   -0.795575
2020-05-13 07:30:00-04:00    1.230427
2020-05-14 07:30:00-04:00   -0.012184
2020-05-15 07:30:00-04:00   -0.786641
Freq: D, dtype: float64
ts_utc.tz_convert("Asia/Shanghai")     # 转到上海时区
2020-05-10 19:30:00+08:00    1.072220
2020-05-11 19:30:00+08:00    2.088327
2020-05-12 19:30:00+08:00   -0.795575
2020-05-13 19:30:00+08:00    1.230427
2020-05-14 19:30:00+08:00   -0.012184
2020-05-15 19:30:00+08:00   -0.786641
Freq: D, dtype: float64

实例化方法

tz_localzie、tz_convert是DatetimeIndex的实例化方法

ts.index.tz_localize('Asia/Shanghai')
DatetimeIndex(['2020-05-10 11:30:00+08:00', '2020-05-11 11:30:00+08:00',
               '2020-05-12 11:30:00+08:00', '2020-05-13 11:30:00+08:00',
               '2020-05-14 11:30:00+08:00', '2020-05-15 11:30:00+08:00'],
              dtype='datetime64[ns, Asia/Shanghai]', freq='D')

时区感知时间戳对象的操作

单独的Timestamp对象也可以从简单时间戳本地为时区感知时间戳

Timestamp对象的转化

stamp = pd.Timestamp('2020-05-10 23:49')
stamp
Timestamp('2020-05-10 23:49:00')
stamp_utc = stamp.tz_localize('utc')  # 本地化
stamp_utc
Timestamp('2020-05-10 23:49:00+0000', tz='UTC')
stamp_utc.tz_convert("Asia/Shanghai")  # 时区转化
Timestamp('2020-05-11 07:49:00+0800', tz='Asia/Shanghai')

创建的时候直接传递时区

stamp_shanghai = pd.Timestamp("2020-05-10 23:58"
                     ,tz="Asia/Shanghai")   # 直接传递时区
stamp_shanghai
Timestamp('2020-05-10 23:58:00+0800', tz='Asia/Shanghai')

时间戳数值不变性

时区感知的Timestamp对象内部存储的一个UNix到现在的时间戳数值,保持不变

stamp_shanghai.value
1589126280000000000
# 结果同上
stamp_shanghai.tz_convert("America/New_York").value  
1589126280000000000

dateOffset

from pandas.tseries.offsets import Hour
data = pd.Timestamp("2020-05-10 01:30"   # 创建一个Timestamp对象
                    ,tz="Asia/Shanghai")
data
Timestamp('2020-05-10 01:30:00+0800', tz='Asia/Shanghai')
data + Hour(2)  # 加上2个小时
# data +2 * Hour()
Timestamp('2020-05-10 03:30:00+0800', tz='Asia/Shanghai')

不同时区的操作

如果两个不同时区的时间序列需要联合,结果将是UTC时间的。时间戳按照UTC格式存储

rng = pd.date_range("2020-05-10 23:43"
                   ,periods=10
                   ,freq="B")
rng
DatetimeIndex(['2020-05-11 23:43:00', '2020-05-12 23:43:00',
               '2020-05-13 23:43:00', '2020-05-14 23:43:00',
               '2020-05-15 23:43:00', '2020-05-18 23:43:00',
               '2020-05-19 23:43:00', '2020-05-20 23:43:00',
               '2020-05-21 23:43:00', '2020-05-22 23:43:00'],
              dtype='datetime64[ns]', freq='B')
ts = pd.Series(np.random.randn(len(rng))   # 随机取值
              ,index=rng)  # 行index
ts
2020-05-11 23:43:00    0.258933
2020-05-12 23:43:00    0.416673
2020-05-13 23:43:00    0.089695
2020-05-14 23:43:00   -0.347376
2020-05-15 23:43:00   -0.304925
2020-05-18 23:43:00   -0.891367
2020-05-19 23:43:00   -0.960866
2020-05-20 23:43:00   -0.420829
2020-05-21 23:43:00    0.591673
2020-05-22 23:43:00    1.431417
Freq: B, dtype: float64
ts1 = ts[:7].tz_localize('Asia/Shanghai')
ts2 = ts1[2:].tz_convert('Europe/Moscow')
ts1
2020-05-11 23:43:00+08:00    0.258933
2020-05-12 23:43:00+08:00    0.416673
2020-05-13 23:43:00+08:00    0.089695
2020-05-14 23:43:00+08:00   -0.347376
2020-05-15 23:43:00+08:00   -0.304925
2020-05-18 23:43:00+08:00   -0.891367
2020-05-19 23:43:00+08:00   -0.960866
Freq: B, dtype: float64
ts2
2020-05-13 18:43:00+03:00    0.089695
2020-05-14 18:43:00+03:00   -0.347376
2020-05-15 18:43:00+03:00   -0.304925
2020-05-18 18:43:00+03:00   -0.891367
2020-05-19 18:43:00+03:00   -0.960866
Freq: B, dtype: float64
result = ts1 + ts2
result
2020-05-11 15:43:00+00:00         NaN
2020-05-12 15:43:00+00:00         NaN
2020-05-13 15:43:00+00:00    0.179391
2020-05-14 15:43:00+00:00   -0.694751
2020-05-15 15:43:00+00:00   -0.609850
2020-05-18 15:43:00+00:00   -1.782735
2020-05-19 15:43:00+00:00   -1.921732
Freq: B, dtype: float64
result.index
DatetimeIndex(['2020-05-11 15:43:00+00:00', '2020-05-12 15:43:00+00:00',
               '2020-05-13 15:43:00+00:00', '2020-05-14 15:43:00+00:00',
               '2020-05-15 15:43:00+00:00', '2020-05-18 15:43:00+00:00',
               '2020-05-19 15:43:00+00:00'],
              dtype='datetime64[ns, UTC]', freq='B')
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351