确保使用dropout降低模型的过拟合几率,特别是在神经元大于256的层之后就应该使用dropout来降低过拟合几率
尽量使用relu作为激活函数,避免使用传统的sigmoid和tanh作为激活函数,传统的这些激活函数的计算开销非常巨大
而且会使之在传递过程中造成梯度爆炸或者梯度弥散,因此不要使用,在使用relu函数之前,最好对输入的数据进行
batch_normalization,使用的基本顺序
卷积神经模型训练的注意事项
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
相关阅读更多精彩内容
- 原文链接:https://yq.aliyun.com/articles/178374 0. 简介 在过去,我写的主...
- https://blog.csdn.net/program_developer/article/details/8...
- 本系列文章面向深度学习研发者,希望通过Image Caption Generation,一个有意思的具体任务,深入...
- (第一部分 机器学习基础)第01章 机器学习概览第02章 一个完整的机器学习项目(上)第02章 一个完整的机器学习...