前言:
numpy是以矩阵为基础的数学计算模块,其基础为多维数组为ndarray
官方文档:(https://docs.scipy.org/doc/numpy/user/index.html)
-
何为ndarray?
一种由相同类型的元素组成的固定的多维数组。(注意黑体字)
-
ndarry创建
代码如下
import numpy as np
np.array([[1,2,3],[4,5,6]])
np.zeros((4,5))
np.ones((2,3,4))#生成一个二维的三行四列 ,值全为1的数组
np.random.randint(1,20,size=(4,5))
np.arange(1,9,2)
#生成等差数列
np.linspace(1,10,4)
#生成等比数列
np.logspace(0,1,3,base=2)#表示在2的0次方和2的1次方之间生成3个等比数列
如下图:
生成随机数组
In[11]: np.random.rand(2,3)#生成一个形状为2*3大小为[0,1)的数组
Out[11]:
array([[0.26931669, 0.22987196, 0.26229279],
[0.24496358, 0.5316016 , 0.24352748]])
-
ndarry属性
randint(low, high=None, size=None, dtype='l')
shape为ndim的属性
dtype判断元素类型
a=np.random.randint(1,3,size=(2,3))
print(a)
print(a.shape)
print(a.dtype)
[[1 1 2]
[1 1 2]]
(2, 3)
int32
-
修改形状
reshape修改复制后的形状
shape在原本的基础上修改
arr=np.random.randint(1,5,8)
arr.reshape(2,4)
arr
array([2, 1, 3, 4, 3, 4, 3, 1])
arr.shape=(4,2)
arr
array([[2, 1],
[3, 4],
[3, 4],
[3, 1]])
-
ndarry运算
矩阵积
np.dot(arr01,arro2)
- ndarry切片
- bool切片
arry10=np.random.randint(1,20,size=(4,2,4))
arry10[2:,0,1:3]
([[17, 9],
[ 7, 4]])
- 花式切片
arry10[[True,False,False,False]]
array([[[14, 12, 13, 18],
[ 5, 7, 5, 16]]])
-
矩阵转置
arr=np.random.ranint(1,10,size=(3,4))
arr.transpose
arr.T
-
聚合函数
求平均值,方差,标准差
#二元函数比较大小np.greater(arr1,arr2),返回的是布尔类型的值
np.greater([4,2],[2,2])
>>>array([ True, False])
#求平均值
arr1=np.array([[1,2,3,4],[2,3,4,5]])
arr1
>>>array([[1, 2, 3, 4],
[2, 3, 4, 5]])
arr1.mean(axis=0)#求每一列的平均值
>>>array([1.5, 2.5, 3.5, 4.5])
arr1.mean(axis=1)#求每一行的平均值
>>>array([2.5, 3.5])
#求方差
np.var(arr,axis=1)
>>>array([1.25, 1.25])
#求标准差
arr1.std(axis=1)
>>>array([1.11803399, 1.11803399])
np.where函数
#np.where(condition,arr1,arr2)
#例子:将np.nan换成0
a1=np.array([
[1,2,np.NaN],
[1,2,np.pi],
[1,2,np.e],
])
condition=np.isnan(a1)
np.where(condition,0,a1)
array([[1. , 2. , 0. ],
[1. , 2. , 3.14159265],
[1. , 2. , 2.71828183]])
np.unique去重复操作
arr2=np.array([0,1,2,11,1,1])
np.unique(arr2)
array([ 0, 1, 2, 11])
后记:
才疏学浅,慢慢学习,慢慢更新,与诸君共勉
你可能感冒的文章:
我的机器学习pandas篇
我的机器学习matplotlib篇
我的机器学习微积分篇