基本原则:超参数而言,没有简单易行的方法来设置,只能依靠理论知识背景和调试经验,不断的试错,达到性能和准度的最佳配比。
常见参数:
学习率(learning rate)
批量大小(batch size)
动量( momentum)
权重衰减(weight decay)
基本原则:超参数而言,没有简单易行的方法来设置,只能依靠理论知识背景和调试经验,不断的试错,达到性能和准度的最佳配比。
常见参数:
学习率(learning rate)
批量大小(batch size)
动量( momentum)
权重衰减(weight decay)