NumPy官网

NumPy 中文网

盖若-NumPy 教程(推荐首选)

菜鸟-NumPy 教程

易百-NumPy教程

NumPy 是一个专业的科学计算库，在数据分析、机器学习、图形图像学、信号处理等领域有着广泛的应用。

本教程将介绍NumPy的原理、语法结构、操作，以掌握 NumPy 在数据分析、可视化、机器学习、图形图像等领域灵活应用。

Numpy 以数组的形式进行数据操作和数学运算，数据分析、机器学习大都是进行数学计算
Numpy 提供了两个基本的对象：

ndarray：存储数据的多维数组

ufunc：对数组进行处理的函数

1. NumPy Ndarray 对象

NumPy 最重要的一个特点是其 N 维数组对象 ndarray，它是一系列同类型数据的集合，以 0 下标为开始进行集合中元素的索引。

ndarray 对象是用于存放同类型元素的多维数组。

ndarray 中的每个元素在内存中都有相同存储大小的区域。

ndarray 内部由以下内容组成：

一个指向数据（内存或内存映射文件中的一块数据）的指针。

数据类型或 dtype，描述在数组中的固定大小值的格子。

一个表示数组形状（shape）的元组，表示各维度大小的元组。

一个跨度元组（stride），其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。

1.1. 数据结构

ndarray 支持一维到多维的数据结构
各维度数据的定义：

1.2. 创建数组

# 导入 numpy 库, 约定俗成别名为 np
import numpy as np

1.2.1. 创建数组的基本方法

序号	方法/函数	调用语法
1	array	np.array(object, dtype, copy, order, subok, ndmin)
2	arange
3	empty	np.empty(shape, dtype, order)
4	zeros	numpy.zeros(shape, dtype = float, order = 'C')
5	ones	numpy.ones(shape, dtype = float, order = 'C')
6	eye	eye(size)
7	random.randn	np.random.randn(size)
8	random.randint	randint([low,high],size)

array: 底层array构造器

# 调用语法
np.array(object, dtype, copy, order, subok, ndmin)

|||| (1) object 数组或嵌套的数列
(2) dtype 数组元素的数据类型，可选
(3) copy 对象是否需要复制，可选
(4) order 创建数组的样式，C为行方向，F为列方向，A为任意方向（默认）分别代表行优先和列优先，在计算机内存中的存储元素的顺序（下同）
(5) subok 默认返回一个与基类类型一致的数组
(6) ndmin 指定生成数组的最小维度|a = np.array([1,2,3]) # 一维数组
a = np.array([[1, 2], [3, 4]]) # 二维数组
a = np.array([1, 2, 3,4,5], ndmin = 2) # 最小维度
a = np.array([1, 2, 3], dtype = complex) # dtype 参数，数组数据类型|
|2|arange||||
|3|empty|np.empty(shape, dtype, order)|(1) shape 数组形状
(2) 创建一个指定形状（shape）、数据类型（dtype）且未初始化的数组
(3) 数组元素为随机值，因为它们未初始化 |x = np.empty([3,2], dtype = int) |
|4|zeros|numpy.zeros(shape, dtype = float, order = 'C')|创建指定大小的全0数组|y = np.zeros((5,), dtype = np.int)
print(y)|
|5|ones|numpy.ones(shape, dtype = float, order = 'C')|创建指定大小的全1数组|y = np.ones((5,), dtype = np.int)|
|6|eye|eye(size)|(1) 创建对角矩阵数组
(2) size是正整数 |a = np.eye(5)|
|7|random.randn|np.random.randn(size)|创建服从 X~N(0,1) 的正态分布随机数组|a=random.randn(2,3)|
|8|random.randint|randint([low,high],size)|(1) 创建一个整数型指定范围在 [low.high] 之间的数组
(2) size 正整数数组 |a=random.randint(100,200,(3,3))|
|9|****||||

2. NumPy 数据类型

常用基本对象

序号	对象名称	描述
1	bool_	布尔型数据类型（True 或者 False）
2	int_	默认的整数类型（类似于 C 语言中的 long，int32 或 int64）
3	intc	与 C 的 int 类型一样，一般是 int32 或 int 64
4	intp	用于索引的整数类型（类似于 C 的 ssize_t，一般情况下仍然是 int32 或 int64）
5	int8	字节（-128 to 127）
6	int16	整数（-32768 to 32767）
7	int32	整数（-2147483648 to 2147483647）
8	int64	整数（-9223372036854775808 to 9223372036854775807）
9	uint8	无符号整数（0 to 255）
10	uint16	无符号整数（0 to 65535）
11	uint32	无符号整数（0 to 4294967295）
12	uint64	无符号整数（0 to 18446744073709551615）
13	float_	float64 类型的简写
14	float16	半精度浮点数，包括：1 个符号位，5 个指数位，10 个尾数位
15	float32	单精度浮点数，包括：1 个符号位，8 个指数位，23 个尾数位
16	float64	双精度浮点数，包括：1 个符号位，11 个指数位，52 个尾数位
17	complex_	complex128 类型的简写，即 128 位复数
18	complex64	复数，表示双 32 位浮点数（实数部分和虚数部分）
19	complex128	复数，表示双 64 位浮点数（实数部分和虚数部分）

3. NumPy 数组属性

NumPy 数组的维数称为秩（rank），秩就是轴的数量，即数组的维度，一维数组的秩为 1，二维数组的秩为 2，以此类推

每一个线性的数组称为是一个轴（axis），也就是维度（dimensions) 。如二维数组相当于是两个一维数组，其中第一个一维数组中每个元素又是一个一维数组。

所以一维数组就是 NumPy 中的轴（axis），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量——秩，就是数组的维数。

axis=0，表示沿着第 0 轴进行操作，即对每一列进行操作；axis=1，表示沿着第1轴进行操作，即对每一行进行操作。

ndarray 对象的重要属性

序号	属性	描述
1	ndarray.ndim	秩，即轴的数量或维度的数量
2	ndarray.shape	数组的维度，对于矩阵数据，n 行 m 列
3	ndarray.size	数组元素的总个数，相当于 .shape 中 n*m 的值
4	ndarray.dtype	ndarray 对象的元素类型
5	ndarray.itemsize	ndarray 对象中每个元素的大小，以字节为单位
6	ndarray.flags	ndarray 对象的内存信息
7	ndarray.real	ndarray元素的实部
8	ndarray.imag	ndarray 元素的虚部
9	ndarray.data	包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性

NumPy Tutorial