python实现神经网络

主要提问点

  • 写出softmax损失函数代码(python),以及交叉熵损失函数
  • 判断和消除过拟合的方法
    dropout,正则项,还有其他的方法?
  • 正则化的方法与原理
    L0,L1,正则化
  • batchnorm的原理,要看论文
  • 手推正向传播反向传播的向量表达式
    梯度消失的原因,除了梯度爆炸/消失以外还应该考虑权值的影响(推完公式里面就能看出来,因为他是链式求导,偏导数相乘)。
  • 动量更新
    区别于sgd的原因
  • 写出几种常见的神经网络
    VGGNet、ResNet
  • Relu激活函数也不能解决梯度消失问题。
    会使得神经元失活
  • 基本超参数的调整方式(调参)
  • 何凯明,提出resnet之前的论文有无了解
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容