MadCoder - 简书

IP属地：台湾

Optimizer and BN
Deep Learning Optimizers optimizers 通用参数待优化参数：, 目标函数：, 初始learning rate：...

3587 0 0
Bag of tricks for Image Classification with CNN
Large-batch training Linear scaling learning ratee.g. ResNet-50 SGD 256 ...

2839 0 0

Models in CV
Backbone Models 1. Inception Version 1 模型特点：采用不同大小的卷积核意味着不同大小的感受野，最后拼接...

2795 0 0
Levenberg-Maquardt Algorithm 推导
前置知识 1. 牛顿法作用：1. 求根 2.求极值求根目标: 求解的根计算穿过初始点并且斜率为的直线与x轴的交点可得 ...

10221 2 1
Distilling the Knowledge in a Neural Network
贡献提出知识蒸馏（Knowledge Distillation）方法，从大模型中学习到的知识中学习有用信息来训练小模型，在保证性能的前提...

5132 0 0