Python气象数据处理进阶之Xarray(6):数据重组与换形

这一部分涉及到了常用的操作,比如调换维度的位置,给数据重新reshape换形等等,建议大家可以认真阅读这部分。
老样子,先新建一个数组

ds = xr.Dataset({'wind': (('time', 'lat', 'lon'), [[[42]]]), 'temperature': (('lat', 'lon'), [[24]])})
print(ds)
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (time, lat, lon) int64 42
#    temperature  (lat, lon) int64 24

ex1调换维度顺序

比如说在求某个东西时需要将时间维放在最后一维,但是数据本身的时间在第一维,那么便可以用到这个操作。
第一种是精准换位,指定每个维度的位置

print(ds.transpose('lat', 'lon', 'time'))
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (lat, lon, time) int64 42
#    temperature  (lat, lon) int64 24

第二种是单独换位,只对指定维度换位,将time放在最后,其余不变

print(ds.transpose(..., 'time'))

第三种为全部换位,相当于数组转置

print(ds.transpose())

ex2数组扩展与压缩

扩展指增加一个维度,压缩指将一个维度挤压掉

expanded  = ds.expand_dims('level')
print(expanded)
#<xarray.Dataset>
#Dimensions:      (lat: 1, level: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, level, lon, time
#Data variables:
#    wind         (level, time, lat, lon) int64 42
#    temperature  (level, lat, lon) int64 24

print(expanded.squeeze('level'))
#<xarray.Dataset>
#Dimensions:      (lat: 1, lon: 1, time: 1)
#Dimensions without coordinates: lat, lon, time
#Data variables:
#    wind         (time, lat, lon) int64 42
#    temperature  (lat, lon) int64 24

官方文档中接下来有一段是关于DataArray向DataSet转换的,个人感觉放在这一章节并不合理,我后边会整理放进Python气象数据处理进阶之Xarray(1)中(我觉得两种基础数据结构以及互相转换应该最开始介绍的)。所以接下来跳过这部分。

ex3堆叠与拆分

个人感觉可能处理站点数据会用到这个方法
换一个数组演示

dr = xr.DataArray(np.random.randn(2, 3),coords=[('country', ['a', 'b']), ('lat', [10, 20, 30])])
print(dr)
#<xarray.DataArray (country: 2, lat: 3)>
#array([[ 0.29837508,  0.27556996,  0.51204495],
#       [-0.15700884,  0.72290308, -1.63887609]])
#Coordinates:
#  * country  (country) <U1 'a' 'b'
#  * lat      (lat) int64 10 20 30

现在将这个2维数组堆叠成1维

print(dr.stack(z=('country', 'lat')))
#<xarray.DataArray (z: 6)>
#array([ 0.29837508,  0.27556996,  0.51204495, -0.15700884,  0.72290308,
#       -1.63887609])
#Coordinates:
#  * z        (z) MultiIndex
#  - country  (z) object 'a' 'a' 'a' 'b' 'b' 'b'
#  - lat      (z) int64 10 20 30 10 20 30

也可以拆分,其实就是反堆叠

stacked = dr.stack(z=('country', 'lat'))
print(stacked.unstack('z'))
#<xarray.DataArray (country: 2, lat: 3)>
#array([[ 0.29837508,  0.27556996,  0.51204495],
#       [-0.15700884,  0.72290308, -1.63887609]])
#Coordinates:
#  * country  (country) object 'a' 'b'
#  * lat      (lat) int64 10 20 30

最重要的是不同于Pandas,Xarray的stack不缺自动丢失缺测值!!!
Xarray还提供了将不同变量stack的例子,有兴趣的可以去看看。这个用法感觉比较鸡肋

ex4 设置与重设索引

da = xr.DataArray(np.random.rand(4),
                  coords={'band': ('x', ['a', 'a', 'b', 'b']), 'wavenumber': ('x', np.linspace(200, 300, 4))},dims='x')
print(da)
#<xarray.DataArray (x: 4)>
#array([0.37036232, 0.34338772, 0.49457694, 0.50916783])
#Coordinates:
#    band        (x) <U1 'a' 'a' 'b' 'b'
#    wavenumber  (x) float64 200.0 233.3 266.7 300.0
#Dimensions without coordinates: x
mda = da.set_index(x=['band', 'wavenumber'])
print(mda)
#<xarray.DataArray (x: 4)>
#array([0.15970166, 0.89733114, 0.25545876, 0.27371103])
#Coordinates:
#  * x           (x) MultiIndex
#  - band        (x) object 'a' 'a' 'b' 'b'
#  - wavenumber  (x) float64 200.0 233.3 266.7 300.0

这块比较难理解,建议还是先读第一篇文章,弄清数据结构,da数组显示Dimensions without coordinates: x,而通过da.set_index函数,将X设置为混合索引号。
之后便可以实线自由索引:

print(mda.sel(band='a'))
#<xarray.DataArray (wavenumber: 2)>
#array([0.15970166, 0.89733114])
#Coordinates:
#  * wavenumber  (wavenumber) float64 200.0 233.3

通过mda.reset_index('x')重置。
reorder_levels()函数允许调换索引顺序(个人感觉比较鸡肋)

mda.reorder_levels(x=['wavenumber', 'band'])

ex5数组滑动

这小节应该是这篇文章和数组换形换维同等重要的。

array = xr.DataArray([1, 2, 3, 4], dims='x')
print(array)
#<xarray.DataArray (x: 4)>
#array([1, 2, 3, 4])
#Dimensions without coordinates: x
print(array.shift(x=2))
#<xarray.DataArray (x: 4)>
#array([nan, nan,  1.,  2.])
#Dimensions without coordinates: x
print(array.roll(x=2, roll_coords=True))
#<xarray.DataArray (x: 4)>
#array([3, 4, 1, 2])
#Dimensions without coordinates: x

这就是对数组进行滚动。这个的作用主要在于做差分计算。虽然前边讲过Xarray提供了中央差计算函数,但是仍需要更灵活的操作,滚动函数就实现了这个目的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352

推荐阅读更多精彩内容