python之numpy的基本使用

一、numpy概述

numpy(Numerical Python)提供了python对多维数组对象的支持:ndarray,具有矢量运算能力,快速、节省空间。numpy支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

二、创建ndarray数组

ndarray:N维数组对象(矩阵),所有元素必须是相同类型。 

ndarray属性:ndim属性,表示维度个数;shape属性,表示各维度大小;dtype属性,表示数据类型。

创建ndarray数组函数:

代码示例:

# -*- coding: utf-8 -*-

import numpy;

print '使用列表生成一维数组'

data = [1,2,3,4,5,6]

x = numpy.array(data)

print x #打印数组

print x.dtype #打印数组元素的类型

print '使用列表生成二维数组'

data = [[1,2],[3,4],[5,6]]

x = numpy.array(data)

print x #打印数组

print x.ndim #打印数组的维度

print x.shape #打印数组各个维度的长度。shape是一个元组

print '使用zero/ones/empty创建数组:根据shape来创建'

x = numpy.zeros(6) #创建一维长度为6的,元素都是0一维数组

print x

x = numpy.zeros((2,3)) #创建一维长度为2,二维长度为3的二维0数组

print x

x = numpy.ones((2,3)) #创建一维长度为2,二维长度为3的二维1数组

print x

x = numpy.empty((3,3)) #创建一维长度为2,二维长度为3,未初始化的二维数组

print x

print '使用arrange生成连续元素'

print numpy.arange(6) # [0,1,2,3,4,5,] 开区间

print numpy.arange(0,6,2)  # [0, 2,4]


三、指定ndarray数组元素的类型

NumPy数据类型:

代码示例:

print '生成指定元素类型的数组:设置dtype属性'

x = numpy.array([1,2.6,3],dtype = numpy.int64)

print x # 元素类型为int64

print x.dtype

x = numpy.array([1,2,3],dtype = numpy.float64)

print x # 元素类型为float64

print x.dtype

print '使用astype复制数组,并转换类型'

x = numpy.array([1,2.6,3],dtype = numpy.float64)

y = x.astype(numpy.int32)

print y # [1 2 3]

print x # [ 1.  2.6  3. ]

z = y.astype(numpy.float64)

print z # [ 1.  2.  3.]

print '将字符串元素转换为数值元素'

x = numpy.array(['1','2','3'],dtype = numpy.string_)

y = x.astype(numpy.int32)

print x # ['1' '2' '3']

print y # [1 2 3] 若转换失败会抛出异常

print '使用其他数组的数据类型作为参数'

x = numpy.array([ 1., 2.6,3. ],dtype = numpy.float32);

y = numpy.arange(3,dtype=numpy.int32);

print y # [0 1 2]

print y.astype(x.dtype) # [ 0.  1.  2.]

四、ndarray的矢量化计算

矢量运算:相同大小的数组键间的运算应用在元素上 

矢量和标量运算:“广播”— 将标量“广播”到各个元素

代码示例:

print 'ndarray数组与标量/数组的运算'

x = numpy.array([1,2,3])

print x*2 # [2 4 6]

print x>2 # [False False  True]

y = numpy.array([3,4,5])

print x+y # [4 6 8]

print x>y # [False False False]

1

2

3

4

5

6

7

8

五、ndarray数组的基本索引和切片

一维数组的索引:与Python的列表索引功能相似

多维数组的索引:

arr[r1:r2, c1:c2]

arr[1,1] 等价 arr[1][1]

[:] 代表某个维度的数据

代码示例:

print 'ndarray的基本索引'

x = numpy.array([[1,2],[3,4],[5,6]])

print x[0] # [1,2]

print x[0][1] # 2,普通python数组的索引

print x[0,1] # 同x[0][1],ndarray数组的索引

x = numpy.array([[[1, 2], [3,4]], [[5, 6], [7,8]]])

print x[0] # [[1 2],[3 4]]

y = x[0].copy() # 生成一个副本

z = x[0] # 未生成一个副本

print y #  [[1 2],[3 4]]

print y[0,0] # 1

y[0,0] = 0

z[0,0] = -1

print y # [[0 2],[3 4]]

print x[0] # [[-1 2],[3 4]]

print z # [[-1 2],[3 4]]

print 'ndarray的切片'

x = numpy.array([1,2,3,4,5])

print x[1:3] # [2,3] 右边开区间

print x[:3] # [1,2,3] 左边默认为 0

print x[1:] # [2,3,4,5] 右边默认为元素个数

print x[0:4:2] # [1,3] 下标递增2

x = numpy.array([[1,2],[3,4],[5,6]])

print x[:2] # [[1 2],[3 4]]

print x[:2,:1] # [[1],[3]]

x[:2,:1] = 0 # 用标量赋值

print x # [[0,2],[0,4],[5,6]]

x[:2,:1] = [[8],[6]] # 用数组赋值

print x # [[8,2],[6,4],[5,6]]

六、ndarray数组的布尔索引和花式索引

布尔索引:使用布尔数组作为索引。arr[condition],condition为一个条件/多个条件组成的布尔数组。

布尔型索引代码示例:

print 'ndarray的布尔型索引'

x = numpy.array([3,2,3,1,3,0])

# 布尔型数组的长度必须跟被索引的轴长度一致

y = numpy.array([True,False,True,False,True,False])

print x[y] # [3,3,3]

print x[y==False] # [2,1,0]

print x>=3 # [ True False  True False  True  False]

print x[~(x>=3)] # [2,1,0]

print (x==2)|(x==1) # [False  True False  True False False]

print x[(x==2)|(x==1)] # [2 1]

x[(x==2)|(x==1)] = 0

print x # [3 0 3 0 3 0]


花式索引:使用整型数组作为索引。

花式索引代码示例:

print 'ndarray的花式索引:使用整型数组作为索引'

x = numpy.array([1,2,3,4,5,6])

print x[[0,1,2]] # [1 2 3]

print x[[-1,-2,-3]] # [6,5,4]

x = numpy.array([[1,2],[3,4],[5,6]])

print x[[0,1]] # [[1,2],[3,4]]

print x[[0,1],[0,1]] # [1,4] 打印x[0][0]和x[1][1]

print x[[0,1]][:,[0,1]] # 打印01行的01列 [[1,2],[3,4]]

# 使用numpy.ix_()函数增强可读性

print x[numpy.ix_([0,1],[0,1])] #同上 打印01行的01列 [[1,2],[3,4]]

x[[0,1],[0,1]] = [0,0]

print x # [[0,2],[3,0],[5,6]]

1

2

3

4

5

6

7

8

9

10

11

12

13

七、ndarray数组的转置和轴对换

数组的转置/轴对换只会返回源数据的一个视图,不会对源数据进行修改。

代码示例:

print 'ndarray数组的转置和轴对换'

k = numpy.arange(9) #[0,1,....8]

m = k.reshape((3,3)) # 改变数组的shape复制生成2维的,每个维度长度为3的数组

print k # [0 1 2 3 4 5 6 7 8]

print m # [[0 1 2] [3 4 5] [6 7 8]]

# 转置(矩阵)数组:T属性 : mT[x][y] = m[y][x]

print m.T # [[0 3 6] [1 4 7] [2 5 8]]

# 计算矩阵的内积 xTx

print numpy.dot(m,m.T) # numpy.dot点乘

# 高维数组的轴对象

k = numpy.arange(8).reshape(2,2,2)

print k # [[[0 1],[2 3]],[[4 5],[6 7]]]

print k[1][0][0]

# 轴变换 transpose 参数:由轴编号组成的元组

m = k.transpose((1,0,2)) # m[y][x][z] = k[x][y][z]

print m # [[[0 1],[4 5]],[[2 3],[6 7]]]

print m[0][1][0]

# 轴交换 swapaxes (axes:轴),参数:一对轴编号

m = k.swapaxes(0,1) # 将第一个轴和第二个轴交换 m[y][x][z] = k[x][y][z]

print m # [[[0 1],[4 5]],[[2 3],[6 7]]]

print m[0][1][0]

# 使用轴交换进行数组矩阵转置

m = numpy.arange(9).reshape((3,3))

print m # [[0 1 2] [3 4 5] [6 7 8]]

print m.swapaxes(1,0) # [[0 3 6] [1 4 7] [2 5 8]]

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

八、ndarray通用函数

通用函数(ufunc)是一种对ndarray中的数据执行元素级运算的函数。

一元ufunc:

一元ufunc代码示例:

print '一元ufunc示例'

x = numpy.arange(6)

print x # [0 1 2 3 4 5]

print numpy.square(x) # [ 0  1  4  9 16 25]

x = numpy.array([1.5,1.6,1.7,1.8])

y,z = numpy.modf(x)

print y # [ 0.5  0.6  0.7  0.8]

print z # [ 1.  1.  1.  1.]

1

2

3

4

5

6

7

8

9

二元ufunc:

二元ufunc代码示例:

print '二元ufunc示例'

x = numpy.array([[1,4],[6,7]])

y = numpy.array([[2,3],[5,8]])

print numpy.maximum(x,y) # [[2,4],[6,8]]

print numpy.minimum(x,y) # [[1,3],[5,7]]

1

2

3

4

5

6

九、NumPy的where函数使用

np.where(condition, x, y),第一个参数为一个布尔数组,第二个参数和第三个参数可以是标量也可以是数组。

代码示例:

print 'where函数的使用'

cond = numpy.array([True,False,True,False])

x = numpy.where(cond,-2,2)

print x # [-2  2 -2  2]

cond = numpy.array([1,2,3,4])

x = numpy.where(cond>2,-2,2)

print x # [ 2  2 -2 -2]

y1 = numpy.array([-1,-2,-3,-4])

y2 = numpy.array([1,2,3,4])

x = numpy.where(cond>2,y1,y2) # 长度须匹配

print x # [1,2,-3,-4]

print 'where函数的嵌套使用'

y1 = numpy.array([-1,-2,-3,-4,-5,-6])

y2 = numpy.array([1,2,3,4,5,6])

y3 = numpy.zeros(6)

cond = numpy.array([1,2,3,4,5,6])

x = numpy.where(cond>5,y3,numpy.where(cond>2,y1,y2))

print x # [ 1.  2. -3. -4. -5.  0.]

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

十、ndarray常用的统计方法

可以通过这些基本统计方法对整个数组/某个轴的数据进行统计计算。

代码示例:

print 'numpy的基本统计方法'

x = numpy.array([[1,2],[3,3],[1,2]]) #同一维度上的数组长度须一致

print x.mean() # 2

print x.mean(axis=1) # 对每一行的元素求平均

print x.mean(axis=0) # 对每一列的元素求平均

print x.sum() #同理 12

print x.sum(axis=1) # [3 6 3]

print x.max() # 3

print x.max(axis=1) # [2 3 2]

print x.cumsum() # [ 1  3  6  9 10 12]

print x.cumprod() # [ 1  2  6 18 18 36]

1

2

3

4

5

6

7

8

9

10

11

12

用于布尔数组的统计方法:

sum : 统计数组/数组某一维度中的True的个数

any: 统计数组/数组某一维度中是否存在一个/多个True

all:统计数组/数组某一维度中是否都是True

代码示例:

print '用于布尔数组的统计方法'

x = numpy.array([[True,False],[True,False]])

print x.sum() # 2

print x.sum(axis=1) # [1,1]

print x.any(axis=0) # [True,False]

print x.all(axis=1) # [False,False]

1

2

3

4

5

6

7

使用sort对数组/数组某一维度进行就地排序(会修改数组本身)。

代码示例:

print '.sort的就地排序'

x = numpy.array([[1,6,2],[6,1,3],[1,5,2]])

x.sort(axis=1)

print x # [[1 2 6] [1 3 6] [1 2 5]]

#非就地排序:numpy.sort()可产生数组的副本

1

2

3

4

5

6

十一、ndarray数组的去重以及集合运算

代码示例:(方法返回类型为一维数组(1d))

print 'ndarray的唯一化和集合运算'

x = numpy.array([[1,6,2],[6,1,3],[1,5,2]])

print numpy.unique(x) # [1,2,3,5,6]

y = numpy.array([1,6,5])

print numpy.in1d(x,y) # [ True  True False  True  True False  True  True False]

print numpy.setdiff1d(x,y) # [2 3]

print numpy.intersect1d(x,y) # [1 5 6]

1

2

3

4

5

6

7

8

十二、numpy中的线性代数

import numpy.linalg 模块。线性代数(linear algebra)

常用的numpy.linalg模块函数:

代码示例:

print '线性代数'

import numpy.linalg as nla

print '矩阵点乘'

x = numpy.array([[1,2],[3,4]])

y = numpy.array([[1,3],[2,4]])

print x.dot(y) # [[ 5 11][11 25]]

print numpy.dot(x,y) # # [[ 5 11][11 25]]

print '矩阵求逆'

x = numpy.array([[1,1],[1,2]])

y = nla.inv(x) # 矩阵求逆(若矩阵的逆存在)

print x.dot(y) # 单位矩阵 [[ 1.  0.][ 0.  1.]]

print nla.det(x) # 求行列式

1

2

3

4

5

6

7

8

9

10

11

12

13

十三、numpy中的随机数生成

import numpy.random模块。

常用的numpy.random模块函数:

代码示例:

print 'numpy.random随机数生成'

import numpy.random as npr

x = npr.randint(0,2,size=100000) #抛硬币

print (x>0).sum() # 正面的结果

print npr.normal(size=(2,2)) #正态分布随机数数组 shape = (2,2)

1

2

3

4

5

6

7

十四、ndarray数组重塑

代码示例:

print 'ndarray数组重塑'

x = numpy.arange(0,6) #[0 1 2 3 4]

print x #[0 1 2 3 4]

print x.reshape((2,3)) # [[0 1 2][3 4 5]]

print x #[0 1 2 3 4]

print x.reshape((2,3)).reshape((3,2)) # [[0 1][2 3][4 5]]

y = numpy.array([[1,1,1],[1,1,1]])

x = x.reshape(y.shape)

print x # [[0 1 2][3 4 5]]

print x.flatten() # [0 1 2 3 4 5]

x.flatten()[0] = -1 # flatten返回的是拷贝

print x # [[0 1 2][3 4 5]]

print x.ravel() # [0 1 2 3 4 5]

x.ravel()[0] = -1 # ravel返回的是视图(引用)

print x # [[-1 1 2][3 4 5]]

print "维度大小自动推导"

arr = numpy.arange(15)

print arr.reshape((5, -1)) # 15 / 5 = 3

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

十五、ndarray数组的拆分与合并

代码示例:

print '数组的合并与拆分'

x = numpy.array([[1, 2, 3], [4, 5, 6]])

y = numpy.array([[7, 8, 9], [10, 11, 12]])

print numpy.concatenate([x, y], axis = 0) 

# 竖直组合 [[ 1  2  3][ 4  5  6][ 7  8  9][10 11 12]]

print numpy.concatenate([x, y], axis = 1) 

# 水平组合 [[ 1  2  3  7  8  9][ 4  5  6 10 11 12]]

print '垂直stack与水平stack'

print numpy.vstack((x, y)) # 垂直堆叠:相对于垂直组合

print numpy.hstack((x, y)) # 水平堆叠:相对于水平组合

# dstack:按深度堆叠

print numpy.split(x,2,axis=0)

# 按行分割 [array([[1, 2, 3]]), array([[4, 5, 6]])]

print numpy.split(x,3,axis=1)

# 按列分割 [array([[1],[4]]), array([[2],[5]]), array([[3],[6]])]

# 堆叠辅助类

import numpy as np

arr = np.arange(6)

arr1 = arr.reshape((3, 2))

arr2 = np.random.randn(3, 2)

print 'r_用于按行堆叠'

print np.r_[arr1, arr2]

'''

[[ 0.          1.        ]

[ 2.          3.        ]

[ 4.          5.        ]

[ 0.22621904  0.39719794]

[-1.2201912  -0.23623549]

[-0.83229114 -0.72678578]]

'''

print 'c_用于按列堆叠'

print np.c_[np.r_[arr1, arr2], arr]

'''

[[ 0.          1.          0.        ]

[ 2.          3.          1.        ]

[ 4.          5.          2.        ]

[ 0.22621904  0.39719794  3.        ]

[-1.2201912  -0.23623549  4.        ]

[-0.83229114 -0.72678578  5.        ]]

'''

print '切片直接转为数组'

print np.c_[1:6, -10:-5]

'''

[[  1 -10]

[  2  -9]

[  3  -8]

[  4  -7]

[  5  -6]]

'''

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

十六、数组的元素重复操作

代码示例:

print '数组的元素重复操作'

x = numpy.array([[1,2],[3,4]])

print x.repeat(2) # 按元素重复 [1 1 2 2 3 3 4 4]

print x.repeat(2,axis=0) # 按行重复 [[1 2][1 2][3 4][3 4]]

print x.repeat(2,axis=1) # 按列重复 [[1 1 2 2][3 3 4 4]]

x = numpy.array([1,2])

print numpy.tile(x,2) # tile瓦片:[1 2 1 2]

print numpy.tile(x, (2, 2))  # 指定从低维到高维依次复制的次数。

# [[1 2 1 2][1 2 1 2]]

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342