在学习机器学习之前,必不可少的一步便是numpy相关的学习,这里我只列出了我目前学习ML遇到过的需要注意或者查阅的numpy基础知识,内容也较为粗略,本意是方便本人日后查阅使用,不过随着学习的深入,也为了方便其他朋友参阅,日后也会慢慢的丰实笔记内容,看在我仅仅也是初学者的份上,暂且写成这般样子吧
numpy基础
numpy.array基础
创建数组
import numpy as np #导入
nparr= np.array([for i in range(10)])
nparr.dtype查看数据类型
np.zeros(10)创建10个浮点数0的数组
np.zeros(10,dtype=int)
np.zeros((3,5)) 创建一个3行5列的二维数组,0为浮点数
np.zeros(shape=(3,5),dtype=int)
np.ones创建全1矩阵同理
np.full(shape=(3,5),fill_value=777)创建全777的3行5列矩阵,整型,若输入777.0则为浮点型
np.arange(0,20,2)相较于python中,步长能为浮点数,默认值均为1
np.linspace(0,20,10)其中第三位10不是步长,表示十个元素,且为等差数列(步长20/9)
np.random.randint(0,10)生成一个从零到10的随机数
np.random.randint(0,10,size=10)生成一个含有十个元素的向量,每个元素都是从零到十(【0,10))的随机数
np.random.randint(0,10,size=(3,5))生成一个3行5列的矩阵,每个元素都是从零到十(【0,10))的随机数
np.random.seed()改变种子
np.random.random()默认生成0和1之间的浮点型随机数
np.random.random((3,5))生成3行5列的矩阵,元素为0和1之间的浮点型随机数
np.random.normal()生成符合正态分布(均值为零方差为1)的浮点型随机数(前面random生成的是均匀的随机数)
np.random.normal(10,100)均值为10,方差为100的正态分布.....
np.random.normal(0,1,(3,5))生成3行5列的矩阵,元素为符合正态分布(均值为零方差为1)的浮点型随机数
基本操作
x=np.arange(15).reshape(3,5)其中reshape将15个元素的一维数组变成3行5列的二维数组
x.reshape(10,-1)指定10行不指定列,x.reshape(-1,10)指定10列不指定行数
x.ndim查看维数
x.shspe返回行数列数,以元祖形式返回
x[2,2]返回第2行第2列的元素,等同于x[(2,2)]
对于一维数组访问时,X[:5]:访问至第五个;X[5:]第六个开始到结束;X[::2]:访问全部,步长为2
对于二维数组,x[:2,:3]访问前两行前三列;x[:2,::2]前两行,所有列的步长为2;x[::-1,::-1]整个矩阵做反转;x[:,0]取第一列;x[0,:]取第一行
subx=x[:2,:3]切片创建子矩阵后,改动subx中的值会引起x中的值改变
subx=x[:2,:3].copy则不会发生上面的改变,得到的是副本
数组的合并与分割
x= np.array([1,2,3])
y= np.array([3,2,1])
np.concatenate([x,y]):将两一维数组直接连接成一维数组123321
A=np.array([ [1,2,3],
[4,5,6]])
np.concatenate([A,A])沿行维度进行合并,成4*3;增加样本
np.concatenate([A,A],axis=1)沿列维度进行合并,成2*6;增加特征
np.concatenate([A,z.reshpae(1,-1)]),将为向量的z转为1*3矩阵后才能用concatenate,生成一个新矩阵
np.vstack([A,z])垂直方向上合并,不同维度也可以
np.hstack()水平方向上合并
x=np.arange(10)
x1,x2,x3=np.spli(x,[3,7])#按照3和7分割成三段
x1,x2=np.split(x,[5])#分割成两段
A=np.arange(16).reshape((4,4))
A1,A2=np.split(A,[2])#前两行为A1,后两行为A2
np.split(x,[...],axis=1)按列分割;axis=0为默认的按行分割
upper,lower=np.vsplit(A,[2])垂直方向进行分割
left,right=np.hsplit=(A,[2])水平方向进行分割
x,y=np.hsplit(data,[-1])#用于分离样本中的标签和数据
y[:,0]#变成向量
运算
矩阵自身的运算:
x=np.arange(1,16).reshape((3,5))
x=x+1
x=x-1
x=x*2
x=x/2#浮点数除法
x=x//2#整数除法
x=x**2#平方运算
x=1/x
x=x%2取余
abs绝对值,sin正弦...
np.power(3,x)以三为点的x中的元素次幂;等价于3**x
两矩阵之间的运算:A+B,A-B
A*B;A/B为两矩阵之间对应元素相乘、相除
A.dot(B)返回AB的乘结果给A
A.T矩阵转置
矩阵和向量的运算:
v=np.array([1,2])
A=np.arange(0,3).reshape((2,2))
v+A向量和矩阵中的每一行相应的向量做假发
相当于先进行:v=np.vstack([v]*A.shape[0])将v向量堆叠A行数次
np.tile(v,(2,1))将v在行方向上堆叠两次,列方向上对叠一次
v*A为v与A中每行向量分别相乘
v.dot(A)为矩阵乘法结果
A.dot(v)也为矩阵乘法,但是是将v变成2*1之后的结果
np.linalg.inv(A)求A的逆矩阵(只有方正才有逆矩阵)
np.linalg.pinv(A)求伪逆矩阵(非方阵求伪逆矩阵)
聚合&&索引
np.sum(L)或者L.sum
np.sum(x,axis=0)把每一列的值相加;axis=1则为每一行的值相加
np.prod(x)每个元素相乘、np.mean()平均值、np.median()中位数
np.argmax(x)返回x最大值索引,np.argmin()
np.argsort(x)排序后返回索引
np.partition(x,3)按照3分为比3小和比3大两部分;np.argpartition返回索引
numpy索引的功能很强大,这里忽略部分内容是认为其在ml中不常用,若后期发现需要用到再进行补充
np.sum(x<=3)计算矩阵中小于等于3的个数
np.sum((x>3)&(x<10))要用位运算符而不是条件运算符&&(x>3返回的是布尔型数组)