登录注册写文章

lstm 调节超参数的注意事项

lstm 调节超参数的注意事项

以下是手动优化RNN超参数时需要注意的一些事：

小心出现过拟合，这通常是因为神经网络在“死记”定型数据。过拟合意味着定型数据的表现会很好，但网络的模型对于样例以外的预测则完全无用。
正则化有好处：正则化的方法包括l1、l2和丢弃法等。
保留一个神经网络不作定型的单独测试集。
网络越大，功能越强，但也更容易过拟合。不要尝试用10,000个样例来学习一百万个参数参数 > 样例数 = 问题。
数据基本上总是越多越好，因为有助于防止过拟合。
定型应当包括多个epoch（使用整个数据集定型一次）。
每个epoch之后，评估测试集表现，判断何时停止（提前停止）。
学习速率是最为重要的超参数。
总体而言，堆叠层是有好处的。
对于LSTM，可使用softsign（而非softmax）激活函数替代tanh（更快且更不容易出现饱和（约0梯度））。
更新器：RMSProp、AdaGrad或momentum（Nesterovs）通常都是较好的选择。AdaGrad还能衰减学习速率，有时会有帮助。
最后，记住数据标准化、MSE损失函数 + 恒等激活函数用于回归、Xavier权重初始化

(https://deeplearning4j.org/cn/lstm)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

BAT机器学习面试1000题系列（二）
101.深度学习（CNN RNN Attention）解决大规模文本分类问题。用深度学习（CNN RNN Att...
大黄大黄大黄阅读 14,771评论 2赞 42
浅谈深度学习基础（上）
第二个Topic讲深度学习，承接前面的《浅谈机器学习基础》。深度学习简介前面也提到过，机器学习的本质就是寻找最...
我偏笑_NSNirvana阅读 16,089评论 7赞 49

跟刘润老师学互联网营销之“单客经济”
这是刘润老师“五分钟商学院”第十二周的第三篇学习笔记：互联网营销之“单客经济”。概念：单客经济定义：利用移动互...
田小丫_Stella阅读 10,858评论 0赞 8
世界上最遥远的距离是你的手机坏了竟没有修
世界上最远的距离不是天各一方，而是你的手机坏了竟然没有及时修。 2017年9月16日星期六多云微信大学好友群...
林秋千阅读 3,770评论 2赞 4
2017年的正式开始
今天大年初四，是今年我上班的第一天，休假8天，8年没有这么的休闲懒散，放松过了。睡了8天的懒觉，但是每天早...
慈朴守中阅读 1,895评论 0赞 0

友情链接更多精彩内容

1赞2赞

赞赏

手机看全文