DSD: Dense-Sparse-Dense training for deep neural network

Approach

In the first D (Dense) step, we train a dense network to learn connection weights and importance. In the S (Sparse) step, we regularize the network by pruning the unimportant connections with small weights and retraining the network given the sparsity constraint. In the final D (re-Dense) step, we increase the model capacityby removing the sparsity constraint, re-initialize the pruned parameters from zero and retrain the whole dense network.

DSD
Algorithm

The consistent and significant performance gain of DSD experiments shows the inadequacy of the current training methods for finding the best local optimum, while DSD effectively achieves superior optimization performance for finding a better solution.

Experiment

GoogLeNet
VGG-16
ResNet

References:
DSD: DENSE-SPARSE-DENSE TRAINING FOR DEEP NEURAL NETWORKS,Song Han, 2017, ICLR

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 一、Mac 1. 前往或直接使用快捷键 Shift+Command+G到路径:/etc/hosts 2. 双击鼠标...
    小小小小筱阅读 572评论 0 1
  • 柜子上贴上文字一目了然 彩色a4纸分隔摆放。 小抽屉可以充分利用空间,用标签实现透视. 小盒子上贴上标签分类清楚,...
    朵朵_79c1阅读 525评论 6 9
  • 东西背的多了,不仅身体累,心也会累。就像出去游玩明明很多用不上的东西却偏要往背包里塞,背包装不下了还有行李箱,行李...
    遇见嘉树阅读 560评论 8 23
  • 黑色的呦 黑色的呦, 你看那颜色如此纯粹, 一点东西都不掺杂, 我不告诉你我讨厌死了这个色彩, 像是把一切都吃掉了...
    暮色柒光年外阅读 163评论 0 1
  • 这一周抓马太多,还是慢综艺看着舒心啊~~~姐今天就继续说说之前安利过的《中餐厅》 这次主题不是老友互怼了,而是看着...
    娱乐拆穿姐阅读 575评论 0 0

友情链接更多精彩内容