五分钟入门 8 个数据分析、机器学习和深度学习包和框架和入门案例总结,提供 8 个数据分析和机器学习常用的工具包。
NumPy
NumPy 是基于 Python 的开源数值计算扩展库,用来存储和处理大型矩阵。
相比于 Python 自身的嵌套列表(nested list structure)结构要高效得多。
NumPy 数组结构也能用来表示矩阵(matrix),详情参考:
主要功能包括:
- N 维数组对象 Array
- 成熟的广播机制
- 能够解决线性代数、随机数生成数相关问题
NumPy 最基本的数据结构 array,下面是关于它的基本操作。
首先,导入 NumPy 包:
In [1]: import numpy as np
NumPy 中,array 函数将 Python 的 list 对象包装为 array:
In [9]: x = np.array([[2, 1], [1, 2]])
In [10]: x
Out[10]:
array([[2, 1],
[1, 2]])
求 x 的转置矩阵:
In [11]: xt = x.transpose()
In [12]: xt
Out[12]:
array([[2, 1],
[1, 2]])
方便的赋值操作:
xt[0, 0] =1.0
dot 操作求两个矩阵的乘积:
In [13]: x2 = xt.dot(x)
In [14]: x2
Out[14]:
array([[5, 4],
[4, 5]])
求逆矩阵,需要导入另一个模块 linalg:
In [19]: import numpy.linalg as lg
In [20]: lg.inv(x2)
Out[20]:
array([[ 0.55555556, -0.44444444],
[-0.44444444, 0.55555556]])