计算梯度:
xid表示训练集合第d个样例的输入分量xi,yd表示第d样例的期望输出值,y′d表示第d样例的实际输出值,这二者的差值就是“损失(loss)”
图片.png
损失函数选用MSE(均分误差):
MSE做损失函数.png
损失函数选用交叉熵:
https://blog.csdn.net/huwenxing0801/article/details/82791879
对w和b的参数进行更新:
- 均方差对参数的偏导:
- 交叉熵对参数的偏导:
......................
结合公式,为了方便计算(求导),可以将log2x简化为lnx