NumPy Tutorial

  • NumPy 是一个专业的科学计算库,在数据分析、机器学习、图形图像学、信号处理等领域有着广泛的应用。
  • 本教程将介绍NumPy的原理、语法结构、操作,以掌握 NumPy 在数据分析、可视化、机器学习、图形图像等领域灵活应用。
  • Numpy 以数组的形式进行数据操作和数学运算,数据分析、机器学习大都是进行数学计算
  • Numpy 提供了两个基本的对象:
  • ndarray:存储数据的多维数组
  • ufunc:对数组进行处理的函数

1. NumPy Ndarray 对象

  • NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。
  • ndarray 对象是用于存放同类型元素的多维数组。
  • ndarray 中的每个元素在内存中都有相同存储大小的区域。
  • ndarray 内部由以下内容组成:
    • 一个指向数据(内存或内存映射文件中的一块数据)的指针。
    • 数据类型或 dtype,描述在数组中的固定大小值的格子。
    • 一个表示数组形状(shape)的元组,表示各维度大小的元组。
    • 一个跨度元组(stride),其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。

1.1. 数据结构

  • ndarray 支持一维到多维的数据结构
  • 各维度数据的定义:

1.2. 创建数组

# 导入 numpy 库, 约定俗成别名为 np
import numpy as np

1.2.1. 创建数组的基本方法

序号 方法/函数 调用语法
1 array np.array(object, dtype, copy, order, subok, ndmin)
2 arange
3 empty np.empty(shape, dtype, order)
4 zeros numpy.zeros(shape, dtype = float, order = 'C')
5 ones numpy.ones(shape, dtype = float, order = 'C')
6 eye eye(size)
7 random.randn np.random.randn(size)
8 random.randint randint([low,high],size)
  • array: 底层array构造器
# 调用语法
np.array(object, dtype, copy, order, subok, ndmin)

|||| (1) object 数组或嵌套的数列
(2) dtype 数组元素的数据类型,可选
(3) copy 对象是否需要复制,可选
(4) order 创建数组的样式,C为行方向,F为列方向,A为任意方向(默认)分别代表行优先和列优先,在计算机内存中的存储元素的顺序(下同)
(5) subok 默认返回一个与基类类型一致的数组
(6) ndmin 指定生成数组的最小维度|a = np.array([1,2,3]) # 一维数组
a = np.array([[1, 2], [3, 4]]) # 二维数组
a = np.array([1, 2, 3,4,5], ndmin = 2) # 最小维度
a = np.array([1, 2, 3], dtype = complex) # dtype 参数 ,数组数据类型|
|2|arange||||
|3|empty|np.empty(shape, dtype, order)|(1) shape 数组形状
(2) 创建一个指定形状(shape)、数据类型(dtype)且未初始化的数组
(3) 数组元素为随机值,因为它们未初始化 |x = np.empty([3,2], dtype = int) |
|4|zeros|numpy.zeros(shape, dtype = float, order = 'C')|创建指定大小的全0数组|y = np.zeros((5,), dtype = np.int)
print(y)|
|5|ones|numpy.ones(shape, dtype = float, order = 'C')|创建指定大小的全1数组|y = np.ones((5,), dtype = np.int)|
|6|eye|eye(size)|(1) 创建对角矩阵数组
(2) size是正整数 |a = np.eye(5)|
|7|random.randn|np.random.randn(size)|创建 服从 X~N(0,1) 的正态分布随机数组|a=random.randn(2,3)|
|8|random.randint|randint([low,high],size)|(1) 创建一个整数型指定范围在 [low.high] 之间的数组
(2) size 正整数数组 |a=random.randint(100,200,(3,3))|
|9|****||||

2. NumPy 数据类型

  • 常用基本对象
序号 对象名称 描述
1 bool_ 布尔型数据类型(True 或者 False)
2 int_ 默认的整数类型(类似于 C 语言中的 long,int32 或 int64)
3 intc 与 C 的 int 类型一样,一般是 int32 或 int 64
4 intp 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64)
5 int8 字节(-128 to 127)
6 int16 整数(-32768 to 32767)
7 int32 整数(-2147483648 to 2147483647)
8 int64 整数(-9223372036854775808 to 9223372036854775807)
9 uint8 无符号整数(0 to 255)
10 uint16 无符号整数(0 to 65535)
11 uint32 无符号整数(0 to 4294967295)
12 uint64 无符号整数(0 to 18446744073709551615)
13 float_ float64 类型的简写
14 float16 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位
15 float32 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位
16 float64 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位
17 complex_ complex128 类型的简写,即 128 位复数
18 complex64 复数,表示双 32 位浮点数(实数部分和虚数部分)
19 complex128 复数,表示双 64 位浮点数(实数部分和虚数部分)

3. NumPy 数组属性

  • NumPy 数组的维数称为秩(rank),秩就是轴的数量,即数组的维度,一维数组的秩为 1,二维数组的秩为 2,以此类推
  • 每一个线性的数组称为是一个轴(axis),也就是维度(dimensions) 。如二维数组相当于是两个一维数组,其中第一个一维数组中每个元素又是一个一维数组。
  • 所以一维数组就是 NumPy 中的轴(axis),第一个轴相当于是底层数组,第二个轴是底层数组里的数组。而轴的数量——秩,就是数组的维数。
  • axis=0,表示沿着第 0 轴进行操作,即对每一列进行操作;axis=1,表示沿着第1轴进行操作,即对每一行进行操作。
  • ndarray 对象的重要属性
序号 属性 描述
1 ndarray.ndim 秩,即轴的数量或维度的数量
2 ndarray.shape 数组的维度,对于矩阵数据,n 行 m 列
3 ndarray.size 数组元素的总个数,相当于 .shape 中 n*m 的值
4 ndarray.dtype ndarray 对象的元素类型
5 ndarray.itemsize ndarray 对象中每个元素的大小,以字节为单位
6 ndarray.flags ndarray 对象的内存信息
7 ndarray.real ndarray元素的实部
8 ndarray.imag ndarray 元素的虚部
9 ndarray.data 包含实际数组元素的缓冲区,由于一般通过数组的索引获取元素,所以通常不需要使用这个属性
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容