点积与乘法运算符
Numpy的乘法运算符*是按元素逐个运算的,与matlab不同。假设矩阵a(m,n) b(n,k),要求a的列数与b的行数相等才可进行乘法运算。
计算规则:a(m,n)*b(n,k)=c(m,k):
matlab环境下,基本运算符按照矩阵乘法处理:
>> a=[1,2,3;2,2,4]
a =
1 2 3
2 2 4
>> b=[3;3;3]
b =
3
3
3
>> a*b
ans =
18
24
使用numpy运算结果是按照矩阵的点积处理:
a = np.array([[1,2,3],[2,2,4]])
b= np.array([3,3,3])
a*b
Out[99]:
array([[ 3, 6, 9],
[ 6, 6, 12]])
矩阵乘法运算需要使用dot函数:
np.dot(a,b)
Out[100]:
array([18, 24])
矩阵转置
矩阵转置把矩阵的行和列互相交换。
matlab操作命令:
>> a=[1,3,2;2,1,5;6,3,1]
a =
1 3 2
2 1 5
6 3 1
>> a'
ans =
1 2 6
3 1 3
2 5 1
numpy操作:
a=np.array([[1,3,2],[2,1,5],[6,3,1]])
a.T
Out[116]:
array([[1, 2, 6],
[3, 1, 3],
[2, 5, 1]])
广播(broadcasting)机制
假设对矩阵X的所有列加上一个向量,基本实现思路可以是这样:
import numpy as np
x = np.array([[1,2,4],[3,2,2],[4,2,5]])
v = [1,0,1]
y = np.empty_like(x)
for i in range(3):
y[i,:] = x[i,:]+v
y
Out[7]:
array([[2, 2, 5],
[4, 2, 3],
[5, 2, 6]])
对矩阵X的每一行进行求和处理,就可以算出最终结果。除此之外,也可以用tile函数将向量按行复制成为与X具有相同shape的矩阵,然后再进行求和:
vv = np.tile(v,(3, 1))
vv
Out[10]:
array([[1, 0, 1],
[1, 0, 1],
[1, 0, 1]])
x+vv
Out[11]:
array([[2, 2, 5],
[4, 2, 3],
[5, 2, 6]])
但是,numpy提供的广播机制可以简化这种shape不同的数组或矩阵之间的基本运算:
x+v
Out[12]:
array([[2, 2, 5],
[4, 2, 3],
[5, 2, 6]])
来看一个基本的例子:
v = np.array([1,2,3])
w = np.array([4,5])
np.reshape(v,(3,1))
Out[15]:
array([[1],
[2],
[3]])
np.reshape(v,(3,1))*w
Out[16]:
array([[ 4, 5],
[ 8, 10],
[12, 15]])
向量v在进行reshape操作之后变成3x1的矩阵,w是一个1x2的向量,在进行点积运算时,广播机制就生效了,最终结果是一个3x2的矩阵。广播机制的两个基本原则:
- 广播之后,输出数组的shape是输入数组shape的各个轴上的最大值,然后沿着较大shape属性的方向复制延伸;
- 要进行广播机制,要么两个数组的shape属性一样,要么其中有一个数组的shape属性必须有一个等于1。
见图(来源:http://www.labri.fr/perso/nrougier/from-python-to-numpy/?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more#broadcasting):
numpy数组与矩阵
大部分情况下,numpy可以利用二维数组完成矩阵的基本操作。二者可以通过mat函数进行转换:
x = np.array([[1,2,3],[2,3,2],[4,2,5]])
y = np.mat(x)
y
Out[46]:
matrix([[1, 2, 3],
[2, 3, 2],
[4, 2, 5]])
进行基本求逆运算:
x*y.I
Out[47]:
matrix([[ 1.00000000e+00, 0.00000000e+00, -5.55111512e-17],
[ -1.11022302e-16, 1.00000000e+00, -2.77555756e-17],
[ 0.00000000e+00, 0.00000000e+00, 1.00000000e+00]])
x*y.I - np.eye(3)
Out[49]:
matrix([[ -2.22044605e-16, 0.00000000e+00, -5.55111512e-17],
[ -1.11022302e-16, 0.00000000e+00, -2.77555756e-17],
[ 0.00000000e+00, 0.00000000e+00, -2.22044605e-16]])
x*y.I - (x*y.I - np.eye(3))
Out[50]:
matrix([[ 1., 0., 0.],
[ 0., 1., 0.],
[ 0., 0., 1.]])
I属性即可取得矩阵的逆矩阵,二维数组不具有该属性。逆矩阵与自身相乘得到的结果应该是一个单位矩阵,由于计算机的运算误差,对角线以外的位置产生了很多极小的误差,因此减去一个同样shape的单位矩阵就可以得到这个误差值,将运算结果减去误差就可以得到一个标准单位矩阵。