登录注册写文章

深度学习-多层感知机

不烫的热水袋

深度学习-多层感知机

多层感知机

概念：多层感知机就是含有至少一个隐藏层的由全连接层组成的神经网络，且每个隐藏层的输出通过激活函数进行变换。多层感知机的层数和各隐藏层中隐藏单元个数都是超参数。以单隐藏层为例并沿用本节之前定义的符号，多层感知机按以下方式计算输出：

激活函数

激活函数	公式	导数公式	优点	缺点
ReLU	$max(x, 0)$	$\text{Relu} '(x) = \begin {cases}1, x>0 \\0, x\leq 0 \end {cases}$	不会同时激活所有神经元，使得计算高效	x<0，梯度是0，导致神经元死亡，权重无法更新
Sigmod	$\frac {1}{1+e^ {-x} }$	${sigmoid} (x) \left(1-\text{sigmoid}(x)\right)$	非线性，适合输出层	两边太平滑导致学习率低；输出不是以0为中心
Tanh	$\frac {e^x-e^{-x}}{e^x+e^{-x}}$	$tanh'(x)= 1-tanh(x)^2$	弥补了sigmod很多缺陷	两边太平滑会导致学习率低

激活函数	原公式图像	导数公式图像
ReLU	relu.png	relu_grad.png
Sigmod	sigmod.png	sigmod_grad.png
Tanh	tanh.png	tanh_grad.png

激活函数的选择

1.通用情况下选择ReLu函数。注意：ReLu函数只能在隐藏层使用。如果出现死神经元，选择PReLu函数。
2.分类问题中，Sigmod函数及其组合通常效果更好，但应避免梯度消失问题。

最后编辑于：2020.02.17 15:25:19

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

第一天-线性回归,Softmax与分类模型,多层感知机
线性回归主要内容包括：线性回归的基本要素线性回归模型从零开始的实现线性回归模型使用pytorch的简洁实现...
LinuxLeeSinYY阅读 4,457评论 0赞 1
多层感知机
多层感知机多层感知机的基本知识使用多层感知机图像分类的从零开始的实现使用pytorch的简洁实现多层感知机...
S思维阅读 2,662评论 0赞 0

「动手学深度学习」多层感知机
主要内容多层感知机的基本知识使用多层感知机图像分类的从零开始的实现使用PyTorch的简洁实现多层感知机的...
icebearC阅读 3,780评论 0赞 0
Day 1 线性回归；Softmax与分类模型、多层感知机
挖坑在家准备论文，看到Datawhale发了14天动手学习AI的宣传，虽然没带笔记本回家，网也不太好，还是决...
Crystality阅读 4,351评论 0赞 0
多层感知机 MLP
多层感知机 MLP 何为多层感知机？就是在简单的神经网络，只包括输入层和输出层的之间加入一层或者多层隐藏层，这样...
VictorHong阅读 6,323评论 0赞 2

友情链接更多精彩内容

赞1赞

赞赏

手机看全文