科学计算工具-numpy

简介

Numpy:提供了一个在Python中做科学计算的基础库,重在数值计算,主要用于多维数组(矩阵)处理的库。
用来存储和处理大型矩阵,比Python自身的嵌套列表结构要高效的多。
本身是由C语言开发,是个很基础的扩展,Python其余的科学计算扩展大部分都是以此为基础。
高性能科学计算和数据分析的基础包
ndarray,多维数组(矩阵),具有矢量运算能力,快速、节省空间
矩阵运算,无需循环,可完成类似Matlab中的矢量运算
线性代数、随机数生成

#导入
import numpy as np

数组创建

NumPy数组是一个多维的数组对象(矩阵),称为ndarray,具有矢量算术运算能力,并具有执行速度快和节省空间的特点。

注意:ndarray的下标从0开始,且数组里的所有元素必须是相同类型

ndarray属性

  • ndim属性:维度个数
  • shape属性:维度大小
  • dtype属性:数据类型

ndarray的随机创建

通过随机抽样(numpy.random)生成随机数据

np.random.rand()
随机样本位于[0,1)中,rand固定取件0.0~1.0

1-1

np.random.randn()
随机样本是从标准正态分布中返回一个或多个样本值

1-2

np.random.randint()
生成指定维度大小(3行4列)的随机多维整型数据(二维),randint()可以指定区间(-1, 5)

1-3

np.random.uniform()
生成指定维度大小(3行4列)的随机多维浮点型数据(二维),uniform()可以指定区间(-1, 5)

1-4

ndarray的序列创建

np.array(collection)
collection为序列型对象(list)、嵌套序列对象(list of list)

#list序列转换为ndarray
list = range(10)
arr = np.array(list)
print(arr)#ndarray数据
print(type(arr))
2-1

np.zeros()指定大小的全0数组。注意第一个参数是数组,用来指定大小,如(3,4)

zeros_arr = np.zeros((3,4))
2-2

np.ones()
指定大小全是1的数组,注意:第一个参数是远足,用来指定大小,如(3,4)

np.ones()
2-3

np.empty()
初始化数组,不是总是返回全0,有时返回的是未初始化的随机值(内存里的随机值)

#np.empty
empty_arr = np.empty((3,3))
#np.empty 指定数据类型
empty_int_arr = np.empty((3,3),int)
2-4

np.arange()和reshape()
arange()类似python的range(),创建一个一维ndarray数组
reshape将重新调整数组的维数

# np.arange() 
arr = np.arange(15) # 15个元素的 一维数组 
print(arr) 
print(arr.reshape(3, 5)) # 3x5个元素的 二维数组
print(arr.reshape(1, 3, 5)) # 1x3x5个元素的 三维数组

2-5

ndarray数据类型

dtype参数
指定数组的数据类型,类型名+位数,如float64,int32

#初始化3行4列数组,数据类型为float64
zeros_float_arr = np.zeros((3,4),dtype=np.float64)
print(zeros_float_arr)
3-1

astype方法

#astype转换数据类型,将已有的数组的数据类型转换为int32
zeros_int_arr = zeros_float_arr.astype(np.int32) 
print(zeros_int_arr) 
print(zeros_int_arr.dtype)


3-2

ndarray的矩阵运算

数组是编程中的概念,矩阵、矢量是数学概念。

在计算机编程中,矩阵可以用数组形式定义,矢量可以用结构定义!

1.矢量运算:相同大小的数组间运算应用在元素上

#矢量与矢量运算
arr = np.array([[1,2,3],[4,5,6]])
print("元素相乘:")
print(arr*arr)
print("矩阵相加:")
print(arr + arr)
4-1

2.矢量和标量运算:"广播"-将标量"广播"到各个元素

#矢量与标量运算
arr = np.array([[1,2,3],[4,5,6]])
print(1./arr)
print(2.*arr)
4-2

ndarray的索引与切片

1.一维数组的索引与切片-与python的列表索引功能相似

#一维数组
arr1 = np.arange(10)
print(arr1)
print(arr1[2:5])
5-1

2.多维数组的索引与切片

arr2 = np.random.randint(1,5,size(3,5))
print(arr2)
print(arr2[2:3])
5-2

3.条件索引
布尔值多维数组:arr[condition],condition也可以是多个条件组合。
注意,多个条件组合要使用 & | 连接,而不是Python的 and or。

# 条件索引 找出 data_arr 中 2005年后的数据 
data_arr = np.random.rand(3,3) 
print(data_arr) 
year_arr = np.array([[2000, 2001, 2000], [2005, 2002, 2009], [2001, 2003, 2010]]) 
is_year_after_2005 = year_arr >= 2005 
print(is_year_after_2005, is_year_after_2005.dtype)

5-3
filtered_arr = data_arr[is_year_after_2005] 
print(filtered_arr) 
# 多个条件 
filtered_arr = data_arr[(year_arr <= 2005) & (year_arr % 2 == 0)] 
print(filtered_arr)

5-4

ndarray的转置

二维数组直接使用转换函数:transpose()
高维数组转换要指定维度编号参数 (0, 1, 2, …),注意参数是元组

arr = np.random.rand(2,3) # 2x3 数组 
print(arr) 
print(arr.transpose()) # 转换为 3x2 数组 
5-5
arr3d = np.random.rand(2,3,4) # 2x3x4 数组,2对应0,3对应1,4对应2 
print(arr3d) 
print(arr3d.transpose((1,0,2))) # 根据维度编号,转为为 3x2x4 数组
5-6

元素计算函数

  • ceil(): 向上最接近的整数,参数是 number 或 array
  • floor(): 向下最接近的整数,参数是 number 或 array
  • rint(): 四舍五入,参数是 number 或 array
  • isnan(): 判断元素是否为 NaN(Not a Number),参数是 number 或 array
  • multiply(): 元素相乘,参数是 number 或 array
  • divide(): 元素相除,参数是 number 或 array
  • abs():元素的绝对值,参数是 number 或 array
  • where(condition, x, y): 三元运算符,x if condition else y
# randn() 返回具有标准正态分布的序列。 
arr = np.random.randn(2,3) 
print(arr) 
print(np.ceil(arr)) 
print(np.floor(arr)) 
print(np.rint(arr)) 

6-1
print(np.isnan(arr)) 
print(np.multiply(arr, arr)) 
print(np.divide(arr, arr)) 
print(np.where(arr > 0, 1, -1))
6-2

元素统计函数

  • np.mean(), np.sum():所有元素的平均值,所有元素的和,参数是 number 或 array
  • np.max(), np.min():所有元素的最大值,所有元素的最小值,参数是 number 或 array
  • np.std(), np.var():所有元素的标准差,所有元素的方差,参数是 number 或 array
  • np.argmax(), np.argmin():最大值的下标索引值,最小值的下标索引值,参数是 number 或 array
  • np.cumsum(), np.cumprod():返回一个一维数组,每个元素都是之前所有元素的 累加和 和 累乘积,参数是 number 或 array
  • 多维数组默认统计全部维度,axis参数可以按指定轴心统计,值为0则按列统计,值为1则按行统计。
arr = np.arange(12).reshape(3,4) 
print(arr) 
print(np.sum(arr)) # 所有元素的和 
print(np.sum(arr, axis=0)) # 数组的按列统计和 
print(np.sum(arr, axis=1)) # 数组的按行统计和
print(np.cumsum(arr)) # 返回一个一维数组,每个元素都是之前所有元素的 累加和 
7-1
arr = np.random.randint(0,10,(3,4))
print(arr)
#所有元素的平均值与和
print(np.mean(arr))
print(np.sum(arr))
#求数组的最大值
print(np.max(arr))
print(np.min(arr))
#方差和标准差:衡量数据和期望值之间的偏离值
#求方差:所有元素都和平均数的差的平方的平均数
print(np.var(arr))
#求标准差:方差的平方根
print(np.std(arr))

7-2
#求最大值和最小值的索引下标
#如果是多维数组,将多维数组合并成一维数组,再找出最大值索引下标
arr = np.arange(10)
print(arr)
print(np.argmax(arr))
print(np.argmin(arr))
#返回一维数组,数组每个元素都是之前每个元素的累加和
print(np.cumsum(arr))
#返回一个一维数组,数组的每一个元素都是之前所有元素的累加积
print(np.cumprod(arr))
7-3
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容