- NumPy 是一个专业的科学计算库,在数据分析、机器学习、图形图像学、信号处理等领域有着广泛的应用。
- 本教程将介绍NumPy的原理、语法结构、操作,以掌握 NumPy 在数据分析、可视化、机器学习、图形图像等领域灵活应用。
- Numpy 以数组的形式进行数据操作和数学运算,数据分析、机器学习大都是进行数学计算
- Numpy 提供了两个基本的对象:
-
ndarray:存储数据的多维数组
-
ufunc:对数组进行处理的函数
1. NumPy Ndarray 对象
- NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。
- ndarray 对象是用于存放同类型元素的多维数组。
- ndarray 中的每个元素在内存中都有相同存储大小的区域。
- ndarray 内部由以下内容组成:
- 一个指向数据(内存或内存映射文件中的一块数据)的指针。
- 数据类型或 dtype,描述在数组中的固定大小值的格子。
- 一个表示数组形状(shape)的元组,表示各维度大小的元组。
- 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。
1.1. 数据结构
-
ndarray 支持一维到多维的数据结构
-
各维度数据的定义:
1.2. 创建数组
# 导入 numpy 库, 约定俗成别名为 np
import numpy as np
1.2.1. 创建数组的基本方法
序号 |
方法/函数 |
调用语法 |
1 |
array |
np.array(object, dtype, copy, order, subok, ndmin) |
2 |
arange |
|
3 |
empty |
np.empty(shape, dtype, order) |
4 |
zeros |
numpy.zeros(shape, dtype = float, order = 'C') |
5 |
ones |
numpy.ones(shape, dtype = float, order = 'C') |
6 |
eye |
eye(size) |
7 |
random.randn |
np.random.randn(size) |
8 |
random.randint |
randint([low,high],size) |
# 调用语法
np.array(object, dtype, copy, order, subok, ndmin)
|||| (1) object 数组或嵌套的数列
(2) dtype 数组元素的数据类型,可选
(3) copy 对象是否需要复制,可选
(4) order 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)分别代表行优先和列优先,在计算机内存中的存储元素的顺序(下同)
(5) subok 默认返回一个与基类类型一致的数组
(6) ndmin 指定生成数组的最小维度|a = np.array([1,2,3]) # 一维数组
a = np.array([[1, 2], [3, 4]]) # 二维数组
a = np.array([1, 2, 3,4,5], ndmin = 2) # 最小维度
a = np.array([1, 2, 3], dtype = complex) # dtype 参数 ,数组数据类型|
|2|arange||||
|3|empty|np.empty(shape, dtype, order)|(1) shape 数组形状
(2) 创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组
(3) 数组元素为随机值,因为它们未初始化 |x = np.empty([3,2], dtype = int) |
|4|zeros|numpy.zeros(shape, dtype = float, order = 'C')|创建指定大小的全0数组|y = np.zeros((5,), dtype = np.int)
print(y)|
|5|ones|numpy.ones(shape, dtype = float, order = 'C')|创建指定大小的全1数组|y = np.ones((5,), dtype = np.int)|
|6|eye|eye(size)|(1) 创建对角矩阵数组
(2) size是正整数 |a = np.eye(5)|
|7|random.randn|np.random.randn(size)|创建 服从 X~N(0,1) 的正态分布随机数组|a=random.randn(2,3)|
|8|random.randint|randint([low,high],size)|(1) 创建一个整数型指定范围在 [low.high] 之间的数组
(2) size 正整数数组 |a=random.randint(100,200,(3,3))|
|9|****||||
2. NumPy 数据类型
序号 |
对象名称 |
描述 |
1 |
bool_ |
布尔型数据类型(True 或者 False) |
2 |
int_ |
默认的整数类型(类似于 C 语言中的 long,int32 或 int64) |
3 |
intc |
与 C 的 int 类型一样,一般是 int32 或 int 64 |
4 |
intp |
用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64) |
5 |
int8 |
字节(-128 to 127) |
6 |
int16 |
整数(-32768 to 32767) |
7 |
int32 |
整数(-2147483648 to 2147483647) |
8 |
int64 |
整数(-9223372036854775808 to 9223372036854775807) |
9 |
uint8 |
无符号整数(0 to 255) |
10 |
uint16 |
无符号整数(0 to 65535) |
11 |
uint32 |
无符号整数(0 to 4294967295) |
12 |
uint64 |
无符号整数(0 to 18446744073709551615) |
13 |
float_ |
float64 类型的简写 |
14 |
float16 |
半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
15 |
float32 |
单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
16 |
float64 |
双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
17 |
complex_ |
complex128 类型的简写,即 128 位复数 |
18 |
complex64 |
复数,表示双 32 位浮点数(实数部分和虚数部分) |
19 |
complex128 |
复数,表示双 64 位浮点数(实数部分和虚数部分) |
3. NumPy 数组属性
- NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度,一维数组的秩为 1,二维数组的秩为 2,以此类推
- 每一个线性的数组称为是一个轴(axis),也就是维度(dimensions) 。如二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组。
- 所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数组,第二个轴是底层数组里的数组。而轴的数量——秩,就是数组的维数。
- axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。
序号 |
属性 |
描述 |
1 |
ndarray.ndim |
秩,即轴的数量或维度的数量 |
2 |
ndarray.shape |
数组的维度,对于矩阵数据,n 行 m 列 |
3 |
ndarray.size |
数组元素的总个数,相当于 .shape 中 n*m 的值 |
4 |
ndarray.dtype |
ndarray 对象的元素类型 |
5 |
ndarray.itemsize |
ndarray 对象中每个元素的大小,以字节为单位 |
6 |
ndarray.flags |
ndarray 对象的内存信息 |
7 |
ndarray.real |
ndarray元素的实部 |
8 |
ndarray.imag |
ndarray 元素的虚部 |
9 |
ndarray.data |
包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性 |