numpy简要(1)

4.1 ndarray:多维数组

数组使得你可以使用类似于标量数据运算的操作,作用于大量数据。

ndarray存储同类型的数据,有两个属性:shape 返回一个tuple,描述每一个维度的尺寸,dtype 返回数据类型。

创建数组

ndarray的默认数据类型为float64。

np.array 函数

data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
函数名称 功能
np.zeros(tuple) ,zeros_like 返回全是0的数组,tuple用于指定维度
ones,ones_like 返回全是1的数组,tuple用于指定维度
empty(tuple), empty_like() 返回空数组,没有进行初始化,要小心
full, full_like 返回给定类型和shape,填充为fill value的值
eye,identity 返回n维单位矩阵

数据类型

ndarray属性的dtype存储类型。numpy中的类型可以与c或Fortran进行对比和交互。

使用astype函数进行转换。

  • float转换为int时,会截断小数点后的值。
  • 如果你的数组内容是代表数字的string,可以使用a.astype(np.float64) 进行转换。
  • astype函数总是创建一个新数组

算数运算

数组使得我们不需要写for循环就可以操作大量数据,这在numpy中称为向量化(vectorization)。任何相同size的数组的算数运算都等同于每个对应的元素的算数运算

不同size的数组运算称为广播(broadcasting) 在附录A进行介绍

基本的索引和切片

一维数组

形式上像列表索引,其实质是对原数组的view,这意味着,对这个view的操作会映射到原数组上。

a=np.arange(10)
a[5:8]=12
print(a)
arr = a[5:8]
arr[:]=23
print(a)
==========================output
[ 0  1  2  3  4 12 12 12  8  9]
[ 0  1  2  3  4 23 23 23  8  9]

从上面还可以看到,如果将一个标量传递给一个数组,那么该值会发生广播

如果确实需要拷贝,可以使用ndarray的copy函数,例如arr[5:8].copy()

多维数组

对于多维数组,最外侧的是axis0,后面依次是axis1,axis2。对于二维数组,可以理解成行(axis0),列(axis1).

在索引时,可以使用array[0][2] 形式,也可以使用array[0,2] 形式。当索引数量小于维数时,得到的是小一维的数组,例如:

arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
arr3d[0]
=========================
array([[1, 2, 3],
       [4, 5, 6]])

多维数组切片时,也是分别针对每一维进行切片,只有一个数字则只切axis0. arr2d[1,:2] arr2d[1:3,2:4]

记住,切片是view,会改变原数组

布尔索引 boolean indexing

使用boolean索引返回True对应的元素组成的数组。在进行条件组合时,使用& | ~ 进行“和,或,求反”,不要使用python内置的and,or。

布尔索引总是创建copy。

对于二维数据的操作,使用pandas将会更方便。

花式索引 fancy indexing

使用一个整数数组的形式进行索引。会按照索引数组的顺序抽取数组元素组成新的数组。

如果传递两个整数数组,则会将两个整数数组配对成tuple,抽取tuple对应的元素,形成一维数组。

如果传递一个全索引: ,和整数数组,则会按照整数数组的顺序抽取数组元素组成新数组,类似于使用一个整数数组的情况,但是可以指定到任意维度。

arr = np.arange(32).reshape((8,4))
print("Origin:\n",arr)
print("arr[[1,5,7,2]]:\n",arr[[1,5,7,2]])
print("arr[[1,5,7,2],[0,1,0,1]]:\n",arr[[1,5,7,2],[0,1,0,1]])
print("arr[[1,5,7,2]][[0,3,1,2],:]\n",arr[[1,5,7,2]][[0,3,1,2],:])
===================================================
Origin:
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]
arr[[1,5,7,2]]:
 [[ 4  5  6  7]
 [20 21 22 23]
 [28 29 30 31]
 [ 8  9 10 11]]
arr[[1,5,7,2],[0,1,0,1]]:
 [ 4 21 28  9]
arr[[1,5,7,2]][[0,3,1,2],:]
 [[ 4  5  6  7]
 [ 8  9 10 11]
 [20 21 22 23]
 [28 29 30 31]]

花式索引会常见数组的复制,生成一个新数组

数组转置和轴变换(transposing arrays and swapping axes)

转置也是一种view,不产生新数组

ndarray有transpose()方法或T 属性都可以求转置。转置在使用np.dot 方法求内积时很有用。

对于多维数组,transpose方法接受一个tuple,指明将原axis按照tuple的顺序进行交换,以三维为例:

a.transpose(2,1,0) 则 $a_{ijk} = b_{kji}$ ,a.transpose(1,2,0) 则 $a_{ijk}=b_{jki}$

a.Tswapaxes 方法的一种简写,使用swapaxes需要提供两个axis,这两个互换。同样可以使用transpose方法实现。a.T 相当于所有axis倒过来。

arr = np.arange(16).reshape((2,2,4))
arr2 = arr.transpose(1,2,0)
print('origin:\n',arr)
print('arr.transpose(1,2,0):\n',arr2)
print('{0:d} == {1:d}'.format(arr[0,1,3],arr2[1,3,0]))
arr3 = arr.swapaxes(1,2)
print(arr3 == arr.transpose(0,2,1))
print(arr.swapaxes(0,2) == arr.transpose(2,1,0))
print(arr.T == arr.transpose(2,1,0))
=====================================output
origin:
 [[[ 0  1  2  3]
  [ 4  5  6  7]]

 [[ 8  9 10 11]
  [12 13 14 15]]]
arr.transpose(1,2,0):
 [[[ 0  8]
  [ 1  9]
  [ 2 10]
  [ 3 11]]

 [[ 4 12]
  [ 5 13]
  [ 6 14]
  [ 7 15]]]
7 == 7
[[[ True  True]
  [ True  True]
  [ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]
  [ True  True]
  [ True  True]]]
[[[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]]
[[[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]

 [[ True  True]
  [ True  True]]]

4.2 全局方法universal function

universal function 或称为ufunc,是对array的每个元素进行处理,可以将其看成是普通函数的向量化封装。

分为:

  • 一元ufunc:abs,fabs, sqrt, square, exp, log, log10, log2, log1p, sign, ceil, floor, rint, modf, isnan, isfinite, isinf, cos, cosh, sin, sinh, tan, tanh, logical_not(~arr)
  • 二元ufunc(需要两个参数):add, subtract, multiply, divide, floor_divide, power, maximum, fmax, minimum, fmin, mod, copysign, greater, greater_equal, less, less_equal, equal, not_equal, logical_and, logical_or, logical_xor

ufunc一般返回一个数组,特别地,modf返回小数部分和整数部分两个数组。

ufunc 一般可以使用out 参数指定结果输出到那个数组,通过将该值制定为原数组可以实现对其更改(operate in-place).

4.3 数组导向编程

通过向量化来完成,这样就不用写循环遍历了。这种速度快1,2个量级。broadcasting是向量化的十分重要的工具。后面会讲。

这里使用np.meshgrid 来举例。np.meshgrid 用于产生坐标网格,接受n个1-D数组,$x_i$ , 返回n个shape为($l_1$,$l_2$ ,$\dots$ ,$l_n$ )的ndarray。其中$l_i$ = len($x_i$ )。

条件判断 np.where

np.where 接受三个参数,一个boolean array,2个array-like,分别记为x,y。如果boolarray为真,则取x的值,否则取y的值。x,y可以不是array,可以是scale。

np.where(arr>0, 2, -2) : 将arr中大于0的置为2,其他的置为-2

np.where(arr>0, 2, arr) : arr中大于0的置为2, 其他的不变。

数学和统计方法

基本的统计方法有:sum, mean, std, var, min, max, argmin, argmax, cumsum, cumprod

使用时可以调用array实例的方法,也可以使用Numpy的顶层函数(使用np.sum(array))

向mean,sum可以接受axis参数,用于指定对于哪个轴进行计算。

argmax, argmin 返回最大,最小值的索引

cumsum, cumprod 是累计加和(从0开始)或累乘(从1开始)得到一个新数组。

arr = np.random.randn(3,4)
print(arr.mean())
print(np.sum(arr))
print(arr.mean(axis=0))
print(arr.cumsum(axis=0))

布尔数组的方法

  • 使用sum()统计True的个数
  • 使用any(),如果有一个True就返回True
  • 使用all(),所有都为True返回True

排序

使用np.sort进行排序。返回一个排序后的拷贝。对于多维数组,可以使用axis参数直接指定对那个轴进行排序。

集合操作

对于1维数组,numpy有一些几何操作:

  • unique(x) : 返回排序后的,x数组的集合
  • intersect1d(x,y): 返回排序后的,x,y共有元素
  • union1d(x,y): 返回排序后的x,y并操作
  • in1d(x,y): 返回boolean array, x in y
  • setdiff1d(x,y): 差集,在x,不在y的元素
  • setxor1d(x,y): 在x或在y,但是不同时在的元素
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,384评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,845评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,148评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,640评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,731评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,712评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,703评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,473评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,915评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,227评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,384评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,063评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,706评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,302评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,531评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,321评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,248评论 2 352

推荐阅读更多精彩内容

  • 一、numpy概述 numpy(Numerical Python)提供了python对多维数组对象的支持:ndar...
    L_steven的猫阅读 3,463评论 1 24
  • 该内容来源于:https://blog.csdn.net/cxmscb/article/details/54583...
    Sper_CL阅读 1,490评论 0 21
  • 来源:NumPy Tutorial - TutorialsPoint 译者:飞龙 协议:CC BY-NC-SA 4...
    布客飞龙阅读 32,761评论 6 96
  • import numpy as np 创建ndarray data1 = [6,7.5, 8, 0, 1]arr1...
    陆文斌阅读 641评论 0 1
  • 基础篇NumPy的主要对象是同种元素的多维数组。这是一个所有的元素都是一种类型、通过一个正整数元组索引的元素表格(...
    oyan99阅读 5,122评论 0 18