一、梯度下降的主要内容
1.梯度下降的需求场景
每个模型都有自己的损失函数,可以想象成包含若干参数的f(x),我们在做机器学习时,都要去找能够使得损失函数尽可能小的参数,使得模型达到最优化的效果。梯度下降算法是对原始模型的损失函数进行优化,便于找到最优的参数,使得损失函数最小。
2.梯度下降的定义
梯度是多元函数的导数,分别对每个变量进行微分,用逗号隔开,形成一个向量。
梯度是指向误差值增长最快的方向,如果在梯度前面加负号,则是指向误差值下降最快的方向。
二、对梯度下降的理解
类似于一个下山的过程
梯度下降就是从群山中山顶找一条最短的路走到山谷最低的方法,主要确定连个变量,每次走的步长,每次选择最陡的方向。

三.梯度算法在线性回归中的应用
线性回归:对样本点进行线性拟合,求得使预测尽可能准确的函数。
通过梯度下降法来求解损失函数

目标函数如下,需要使得目标函数尽可能小

进行整理得到如下

对上式进行求导

进一步转化

对整体除以m,目标函数转为下式,也为MSE
最终的表达式如下:

