[ML] LR 损失函数为什么用极大似然函数？

想要让每一个样本的预测都要得到最大的概率，即将所有的样本预测后的概率进行相乘都最大，也就是极大似然函数.
对极大似然函数取对数以后相当于对数损失函数，由梯度更新的公式可以看出，对数损失函数的训练求解参数的速度是比较快的，而且更新速度只和x，y有关，比较的稳定，
为什么不用平方损失函数?
如果使用平方损失函数，梯度更新的速度会和 sigmod 函数的梯度相关，sigmod 函数在定义域内的梯度都不大于0.25，导致训练速度会非常慢。
而且平方损失会导致损失函数是 $\theta$ 的非凸函数，不利于求解，因为非凸函数存在很多局部最优解。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Logistic Regression 为什么用极大似然函数
1. 简述 Logistic Regression Logistic regression 用来解决二分类问题， ...
不会停的蜗牛阅读 13,474评论 0赞 9
线性回归，逻辑回归的学习（包含最小二乘法及极大似然函数等）
回归问题的前提： 1）收集的数据 2）假设的模型，即一个函数，这个函数里含有未知的参数，通过学习，可以估计出参...
xxyytt阅读 8,138评论 0赞 10
心若远，身难近
结婚十年，已是相对无言。婚姻是两个人的相互忍让，只是，一方已无视另一方的任何情绪。似乎孩子是唯一的牵绊，只是，...
icecreamsue阅读 1,826评论 0赞 0
碎碎念
早上，老公送孩子上学。饱饱地睡个懒觉。八点起床，开窗，阳光明媚。窗外的马路上，车流穿梭，人们忙忙碌碌，一派欢乐。 ...
尚妮妮阅读 2,325评论 2赞 3
成长日记【第二十八天】
你是一个有意志力的人吗？你的意志力有多强？我说，我不知道。我不知道前方等待我的是怎样的困难与挑战，不知道我能否成功...
一棵树的时光阅读 1,644评论 0赞 0

赞1赞

赞赏

手机看全文