均值移除、范围缩放、归一化 什么时候用哪个? 可以一起用吗?
独热编码(一般用于离散数据,连续性的会造成“维度灾难“)可以双向转换
标签编码 一次只能处理一维数据 可以双向转换
二值化不可逆
1)判断以下哪个是回归问题,哪个是分类问题,哪个是聚类问题:
判断一封邮件是否为垃圾邮件 分类 离散的 是与不是
在图像上检测出人脸的位置 回归 某个范围内的都可能出现 属于连续值 回归问题
视频网站根据用户观看记录,找出喜欢看战争电影的用户 聚类 根据已知输入的相似程度,将其划分为不同的类别
2)分类和聚类主要区别是什么? 分类属于监督学习 聚类属于无监督学习
3)判断以下哪些是数据降维问题
将88的矩阵缩小为44的矩阵 是
将二维矩阵变形为一维向量 不是
矩阵相乘 点乘=点积
a的所有行 乘以b的所有列 对应位置相乘后再相加
a的列数 = b的行数 才能相乘 结果的形状是a的行数和b的列数 矩阵不符合乘法的交换律
loss函数最小值问题
梯度下降法: 求解模型最优参数
求损失函数最小值
单位矩阵:对角线上的值为1 其余为0
a如果乘以b 能得到单位矩阵 那么b是a的逆矩阵
m.I 表示求逆矩阵 有可能不存在
只有方阵(行列相等)才有逆矩阵 还有伪逆矩阵
特征数量较多 计算逆矩阵会耗时
机器学习:用梯度下降求损失函数的最小值
梯度=导数
沿着梯度的方向下降的最快 所以沿着梯度的方向下降
负梯度 = 梯度的反方向
学习率 控制下降的速度
超参数:在构建模型或者训练模型时,需要人为设定一系列的参数,并且这些参数能够影响模型的精度
超参数的设定取决于经验 调参
学习率过大会梯度爆炸 0.1就算很大的
震荡说明学习率过大了
x=x-a*导数
偏导数:求其中一个的时候 将另外一个看做常量