为什么在分类问题中常用交叉熵而不是MSE或者平均误差?

  1. 交叉熵可以在得到正确结果的同时衡量模型的好坏;
  2. 交叉熵在模型不能很好拟合的似乎求的偏导大,而模型拟合的差不多之后偏导变小。对比之下,MSE在训练一开始就偏导趋近于0,不好训练。
  3. 交叉熵和sigmoid一起用,求导形式非常简洁。
    https://zhuanlan.zhihu.com/p/35707643
    https://zhuanlan.zhihu.com/p/35709485
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容