第一章 Numpy学习 2020-08-16

注意⚠️:

这里所有的演示代码都要引入NumPy,代码如下:

import numpy as np

1.认识Numpy库

在没有使用Numpy时候对矩阵进行运算:

def pySum():
    a = [0,1,2,3,4]
    b = [9,8,7,6,5]
    c = []
    for i in range(len(a)):
        c.append(a[i]**2+b[i]**3)
    return c
    
print(pySum()) 

使用Numpy进行矩阵运算:

def pySum():
    a = [0,1,2,3,4]
    b = [9,8,7,6,5]
    c = []
    for i in range(len(a)):
        c.append(a[i]**2+b[i]**3)
    return c
    
print(pySum()) 
1.1 N维数组对象:ndarray

ndarray是一个多维数组对象,由两部分构成:

  1. 实际的数据
  2. 描述这些数据的元数据(数据纬度、数据类型等)

注解:ndarray数组一般要求所有元素类型相同(同质),数组下标从0开始


1.2 ndarray对象的属性
属性 说明
.ndim 秩,即轴的数量或纬度的数量
.shape ndarray对象的尺度,对于矩阵,n行m列
.size ndarray对象的个数,相当于.shape中n\times m的值
.dtype ndarray对象的元素类型
.itemsize ndarray对象中每个元素的大小,以字节为单位

代码演示:

a = np.array([[0,1,2,3,4],
              [9,8,7,6,5]])
print(a.ndim)
print(a.shape)
print(a.size)
print(a.dtype)
print(a.itemsize)

运行结果:

2
(2, 5)
10
int64
8

1.3 ndarray的元素类型
数据类型 说明
bool 布尔类型,Ture或False
intc 与C语言中的int类型一致,一般是int32或int64
intp 用于索引的整数,与C语言中ssize_t一致,int32或int64
int8 字节长度的整数,取值:[-128,127]
int16 16位长度的整数,取值:[-32768,32767]
int32 32位长度的整数,取值:[-2^{31}2^{31}-1]
int64 64位长度的整数,取值:[-2^{63}2^{63}-1]
uint8 8位无符号整数,取值:[0,255]
uint16 16位无符号整数,取值:[0,65535]
uint32 32位无符号整数,取值:[0,2^{32}-1]
uint64 64位无符号整数,取值:[0,2^{64}-1]
float16 16位半精度浮点数:1位符号位,5位指数,10位尾数
float32 32位半精度浮点数:1位符号位,8位指数,23位尾数
float64 64位半精度浮点数:1位符号位,11位指数,53位尾数

2.ndarray数组的创建方法

2.1 从Python中的列表、元组等类型创建ndarray数组

代码演示:

x =np.array([[1,2],[2,4],(0.1,0.2)])
print(x)
print(x.dtype)

运行结果:

[[1.  2. ]
 [2.  4. ]
 [0.1 0.2]]
float64

2.2 使用NumPy中函数创建ndarray数组
函数 说明
np.arange(n) 类似range()函数,返回ndarray类型,元素从0到n-1
np.ones(shape) 根据shape生成一个全1数组,shape是元组类型
np.zeros(shape) 根据shape生成一个全0数组,shape是元组类型
np.full(shape,val) 根据shape生成一个数组,每个元素值都是val
np.eye(n) 创建一个正方的n\times n单位矩阵,对角线为1,其余为0
np.ones_like(a) 根据数组a的形状生成一个全1数组
np.zeros_like(a) 根据数组a的形状生成一个全0数组
np.full_like(a,val) 根据数组a的形状生成一个数组,每个元素值都是val

2.3 使用NumPy中其他函数创建ndarray数组
函数 说明
np.linspace() 根据起止数据等间距地填充数据,形成数组
np;concatenate() 将两个或多个数组合并生成一个新的数组

代码演示:

a = np.linspace(1,10,4)
b = np.linspace(1,10,4,endpoint=False)
c = np.concatenate((a,b))
print(a)
print(b)
print(c)

运行结果:

[ 1.  4.  7. 10.]
[1.   3.25 5.5  7.75]
[ 1.    4.    7.   10.    1.    3.25  5.5   7.75]

2.4 ndarray数组的纬度变换
方法 说明
.reshape(shape) 不改变数组元素,返回一个shape形状的数组,原数组不变
.resize(shape) 与.reshape()功能一致,但修改原数组
.swapaxes(ax1,ax2) 将数组n个纬度中两个维度进行调换
.flatten() 对数组进行降维,返回折叠后对一维数组,原数组不变

2.5 ndarray数组对类型变换

new_a = a.astype(new_type)

astype()方法一定会创建新对数组(原始数据对一个拷贝),即使两个类型一致


2.6 ndarray数组向列表的转换

a.tolist()


3.数组的索引和切片

3.1 一维数组的索引和切片

与Python的列表类似

程序演示:

a = np.array([9,8,7,6,5])
print(a[2])
print(a[1:4:2])

运行结果:

7
[8 6]

3.2 多维数组的索引和切片

程序演示:

b = np.arange(24).reshape([2,3,4])
print(b)
print(b[:,1,-3])
print(b[:,1:3,:])
print(b[:,:,::2])

运行结果:

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]
[ 5 17]
[[[ 4  5  6  7]
  [ 8  9 10 11]]

 [[16 17 18 19]
  [20 21 22 23]]]
[[[ 0  2]
  [ 4  6]
  [ 8 10]]

 [[12 14]
  [16 18]
  [20 22]]]

4.数组与标量之间的运算

4.1 NumPy一元函数

对ndarray中的数据执行元素级运算的函数

函数 说明
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x) np.log2(x) 计算数组各元素的自然对数、10底对数和2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值或floor值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x) 计算数组各元素的普通型和双曲型三角函数
np.sin(x) np.sinh(x)
np.tan(x) np.tanh(x)
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值,1(+),0,-1(-)

4.2 NumPy二元函数
函数 说明
+ - * / ** 两个数组各元素进行对应运算
np.maximun(x,y) np.fmax() 元素间的最大值计算
np.minimun(x,y) np.fmin() 元素间的最小值计算
np.mod(x,y) 元素级的模运算
> < >= <= == != 算数比较,产生布尔型数组

5.CSV文件

5.1 CSV简述

CSV(Comma-Separated Value,逗号分割值)

CSV是一种常见的文件格式,用来存储批量数据


5.2 CSV的存储

np.savetxt(frame,array,fmt='%.18e',delimiter=None)

  1. frame:文件、字符串或生产器,可以是.gz或.bz2的压缩文件
  2. array:存入文件的数组
  3. fmt:写入文件的格式,例如:%d %.2f %.18e(默认)
  4. delimiter:分割字符串,默认是任何空格

代码演示:

a = np.arange(100).reshape(5,20)

np.savetxt('a.csv',a,fmt='%d',delimiter=',')
np.savetxt('b.csv',a,fmt='%.1f',delimiter=',')

5.3 CSV的读入

np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)

  1. frame:文件、字符串或生产器,可以是.gz或.bz2的压缩文件
  2. dtype:数据类型,可选
  3. delimiter:分割字符串,默认是任何空格
  4. unpack:如果Ture,读入属性将分别写入不同变量

代码演示:

c = np.loadtxt('b.csv',delimiter=',')
print(c)

运算结果:

[[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10. 11. 12. 13. 14. 15. 16. 17.
  18. 19.]
 [20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37.
  38. 39.]
 [40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57.
  58. 59.]
 [60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77.
  78. 79.]
 [80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97.
  98. 99.]]

劣势⚠️

CSV只能储存和读入一纬和二维数组


6.多维数据的存取

6.1 存

np.tofile(frame,sep='',format='%s')

  1. frame:文件、字符串
  2. sep:数据分割字符串,如果是空串,写入文件为二进制
  3. format:写入数据的格式

代码演示:

a = np.arange(100).reshape(5,10,2)

a.tofile("b.dat",sep=",",format='%d')
a.tofile("c.dat",format='%d')

6.2 取

np.fromfile(frame,dtype=float,count=-1,sep='')

  1. frame:文件、字符串
  2. dtpye:读取的数据类型
  3. count:读入元素个数,-1表示读入整个文件
  4. sep:数据分割字符串,如果是空串,写入文件为二进制

代码演示:

c = np.fromfile('b.dat',dtype=np.int,sep=',')
print(c)

c = np.fromfile('b.dat',dtype=np.int,sep=',').reshape(5,10,2)
print(c)

需要注意⚠️

该方法需要读取时知道存入文件时数组的维度和元素类型

a.tofile()和np.fromfile()需要配合使用

可以通过元数据文件来存储额外信息


7.Numpy的便捷文件存取

7.1 存

np.save(frame,array)或np.savez(frame,array)

  1. frame:文件名,以.npy为扩展名,压缩扩展名为.npz
  2. array:数组变量

代码演示:

a = np.arange(100).reshape(5,10,2)
np.save('a.npy',a)

7.2 取

np.load(frame)

  1. frame:文件名,以.npy为扩展名,压缩扩展名为.npz
    代码演示:
b = np.load('a.npy')
print(b)

8.Numpy的随机数函数子库

8.1 Numpy的random子库

np.random的随机数函数

函数 说明
rand(d0,d1,...,dn) 根据d0-dn创建随机数函数,浮点数,[0,1),均匀分布
randn(d0,d1,...,dn) 根据d0-dn创建随机数函数,标准正态分布
randint(low,high,[shape]) 根据shape创建随机整数或整数数组,范围是[low,high]
seed(s) 随机数种子,s是给定的种子值

代码演示:

np.random.seed(10)#n次不变

a = np.random.rand(3,4,5)
print("a=",a)

sn = np.random.randn(3,4,5)
print("sn=",sn)

b = np.random.randint(100,200,(3,4))
print("b=",b)

8.2 np.random的随机数函数
函数 说明
shuffle(a) 根据数组a的第1轴进行随排列,改变数组a
permutation(a) 根据数组a的第1轴产生一个新的乱序数组,不改变数组a
choice(a,[size,replace,p]) 从一维数组a中以概率p抽取元素,形成size形状的新数组replace表示是否可以重用元素,默认为False

代码演示:

np.random.shuffle(b)
print(b)

print(np.random.permutation(b))

c = np.random.randint(100,200,(8,))

print(c)
print(np.random.choice(c,(3,2)))
print(np.random.choice(c,(3,2),replace=False))
print(np.random.choice(c,(3,2),p=c/np.sum(c)))

8.3 np.random的随机数函数
函数 说明
uniform(low,high,size) 产生具有均匀分布的数组,low起始值,high结束值,size形状
normal(loc,scale,size) 产生具有正态分布的数组,loc均值,scale标准差,size形状
poisson(lam,size) 产生具有泊松分布的数组,lam随机事件发生率,size形状

代码演示:

u = np.random.uniform(0,10,(3,4))
print(u)

n = np.random.normal(10,5,(3,4))
print(n)

9.Numpy的统计函数

9.1 np的统计函数
函数 说明
sum(a,axis=None) 根据给定轴axis计算数组a相关元素之和,axis整数或元组
mean(a,axis=None) 根据给定轴axis计算数组a相关元素的期望,axis整数或元组
average(a,axis=None,weights=None) 根据给定轴axis计算数组a相关元素的加权平均值
std(a,axis=None) 根据给定轴axis计算数组a相关元素的标准差
var(a,axis=None) 根据给定轴axis计算数组a相关元素的方差|

代码演示:

a = np.arange(15).reshape(3,5)

print(a)

print(np.sum(a))

print(np.average(a,axis=1))
print(np.average(a,axis=0))

print(np.average(a,axis=0,weights=[10,5,1]))

运行结果:

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]
105
[ 2.  7. 12.]
[5. 6. 7. 8. 9.]
[2.1875 3.1875 4.1875 5.1875 6.1875]

9.2 np的统计函数
函数 说明
min(a) max(a) 计算数组a中元素最小值、最大值
argmin(a) argmax(a) 计算数组a中元素最小值、最大值的降一维后下标
unravel_index(index,shape) 根据shape将一维下标index转换成多维下标
ptp(a) 计算数组a中元素最大值和最小值的差
median(a) 计算数组a中元素的中位数(中值)

代码演示:

print(np.max(a))

print(np.argmax(a))

print(np.unravel_index(np.argmax(a),a.shape))

print(np.ptp(a))

print(np.median(a))

运行结果:

14
14
(2, 4)
14
7.0

10.Numpy的梯度函数

10.1 np的梯度函数

np.gradient(f)

计算数组f中元素的梯度,当f为多维时,返回每个维度的梯度

梯度:连续值之间的变化率,即斜率

代码演示:

a = np.random.randint(0,20,(5))
print(a)

print(np.gradient(a))

c = np.random.randint(0,50,(3,5))
print(c)
print(np.gradient(c))

11.实例:图片风格化

11.1 PIL库简述

PIL,Python Image Library

PIL库是一个具有强大图线处理能力的第三方库

在命令行下的安装方法:pip install pillow

from PIL import Image

Image是PIL库中代表一个图像的类(对象)

代码演示:

im = np.array(Image.open("../1.JPG"))#引入对象

print(im.shape)
print(im.dtype)
11.2 图像的变换

代码演示:

import numpy as np
from PIL import Image

a = np.array(Image.open('../1.JPG'))

b = [255,255,255] - a

im = Image.fromarray(b.astype('uint8'))

im.save("../2.JPG")

a = np.array(Image.open('../1.JPG').convert('L'))

b = 255 - a

im = Image.fromarray(b.astype('uint8'))

im.save("../3.JPG")

b = (100/255)*a + 150#区间变换

im = Image.fromarray(b.astype('uint8'))

im.save("../4.JPG")

b = 255*(a/255)**2#像素平方

im = Image.fromarray(b.astype('uint8'))

im.save("../5.JPG")

11.3 手绘效果
图像的手绘效果

特征:

  1. 黑白灰色
  2. 边界线条较重
  3. 相同或相近色彩趋近于白色
  4. 略有光源效果
梯度的重构

利用像素之间的梯度值和虚拟深度值对图像进行重构

a = np.array(Image.open('../pc.JPG').convert('L')).astype('float')

depth = 15  #预设深度值为10 取值范围0-100
grad = np.gradient(a)
grad_x , grad_y = grad    #提取x和y方向对梯度值
grad_x = grad_x*depth/100
grad_y = grad_y*depth/100   #根据深度调整x和y方向对梯度值,/100是对梯度值对归一化
光源效果

根据灰度变化来模拟人类视觉对远近程度

设计一个位于图像斜上方对虚拟光源

光源相对于图像对俯视角为Elevation,方位角为Azimuth

建立光源对各点梯度值对影响函数

运算出各点对新像素值

vec_el = np.pi/2.2
vec_az = np.pi/4.
dx = np.cos(vec_el)*np.cos(vec_az)
#np.cos(vec_el)为单位光线在地平面上对投影长度
#dx,dy,dz是光源对x/y/z三个方向对影响程度
dy = np.cos(vec_el)*np.sin(vec_az)
dz = np.sin(vec_el)
  • 梯度归一化
A = np.sqrt(grad_x**2 + grad_y**2 + 1)  #构造x和y轴梯度对三维归一化单位坐标系
uni_x = grad_x/A
uni_y = grad_y/A
uni_z = 1./A
b = 255*(dx*uni_x + dy*uni_y + dz*uni_z)    #梯度与光源相互作用,将梯度转化为灰度
  • 图像生成
b = b.clip(0,255)
im = Image.fromarray(b.astype('uint8'))
im.save('../1_shouhui.jpg')

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容