softmax and overfitting

softmax这个结果就可以描述为每个类的概率

softmax这个结果可以描述为每个类的概率

故,不会造成学习慢!是根据信息熵的概念进行求解。

Overfitting

例如我们利用1000个数据作为训练,表现出的情况:

Cost表现看起来还不错,Test的变化如下:

当然了还有其他的方式来客服Overfitting

实验证明一下:


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容