登录注册写文章

吃瓜第五章神经网络 2023-12-23

吃瓜第五章神经网络 2023-12-23

神经网络

1 神经元模型

1.1 M-P神经元

M-P神经元模型

“在这个模型中，神经元接收到来自其他n个神经元传递过来的输入信号，这些信号通过带权值的连接进行传递，神经元把接收到的总收入值与阈值进行比较，然后通过激活函数处理来产生输出。“——《机器学习》周志华

1.2 激活函数

常用Sigmoid函数，把在较大范围内变化的输入值挤压到(0, 1)输出范围内。

sigmoid

更多的激活函数请见https://zh-v2.d2l.ai/chapter_multilayer-perceptrons/mlp.html 中4.1.2节。

单个M-P神经元：感知机（sgn作激活函数）、对数几率回归（sigmoid作激活函数）
多个M-P神经元：神经网络

2 感知机与多层网络

2.1 感知机

从几何角度说，给定一个线性可分的数据集T，感知机的学习目标是求得能对数据集T中正负样本完全正确划分的超平面。

2.2 感知机算法

感知机由两层神经元。假设计算
$y = f(\sum_i w_ix_i - \theta)$ ， $f$ 是阶跃函数， $y$ 的值是0或1。

感知机

其中

x

是样本的特征向量，是感知机的输入，

w

是权值，

\theta

是阈值。
阈值可以看作一个输入固定为-1的”哑节点“的权值。

损失函数：

损失函数

若分类全部正确，则损失函数值一定为０。
学习使用随机梯度下降，则每次更新参数只使用一个误分类点。若当前输出为 $y$ ，则新的权值是：
$w_i \leftarrow w_i + \eta (y-\hat{y}) x_i$ $\theta \leftarrow \theta - \eta (y-\hat{y})$ 不断更新，直至对所有样本点都分类正确。

2.3 多层感知机

但是，单层感知机只能解决线性分类问题，要解决非线性可分问题，需要使用多层感知机。

线性可分

神经网络是层级结构，每层神经元与下层全互连，不存在同层连接的，称为多层前馈神经网络。
分为输入层、隐藏层、输出层。

前馈神经网络

3 反向传播算法BP

反向传播是实现梯度下降的一种具体方式。
假设如下网络（激活函数是Sigmoid）：

对隐藏层的每个节点，要算它与

l

个输出节点和

d

个输入节点分别的连接权重，以及自己的阈值。对每个输出节点，还要算自己的阈值。所以一共有

(d+l+1)q+l

个参数参与计算。

$w_{hj}$ 权重更新：

得到

w_{hj}=w_{hj}-\eta g_jb_h

权重的更新值为学习率×

g_j

×隐藏层第h个神经元的输出。
类似可得

其中

theta_j

是输出层第j个神经元的阈值，

v_{ih}

是输入层第i个到隐藏层第h个的权重，

\gamma _h

是隐藏层第h个神经元的阈值。

e_h

：

e_h

标准BP流程（每次针对一个样例进行更新）：

误差逆传播算法

标准BP算法往往需要更多次迭代，才能到达累计误差最小点。累积BP算法参数更新的频率小的多，但是在很多任务中，当累计误差下降到一定程度之后，进一步下降会非常缓慢，这是标准BP往往更快获得较好的解。

解决过拟合：

早停：用训练集来更新参数，验证集用来估计误差。如果训练集误差降低了但验证集误差升高了，就停止。
正则化：损失函数里加与模型规模相关的惩罚项。

参考：

南瓜书https://www.bilibili.com/video/BV1Mh411e7VU/?p=1&vd_source=32ad22ca1aa5a882c8b7fe1b7878657f
《机器学习》周志华

最后编辑于：2023.12.24 09:37:58

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

吃瓜学习笔记4-第五章神经网络（感知机、多层前馈网络、误差逆传播算法BP,过拟合）
感知机感知机由两层神经元组成，如图5.3 所示，输入层接收外界输入信号后传递给输出层，输出层是M-P 神经...
曼曼668阅读 1,145评论 0赞 1
【DW 11月-西瓜书学习笔记】Task04：第五章神经网络
第五章神经网络所谓神经网络，目前用得最广泛的一个定义是“神经网络是由具有适应性的简单单元组成的广泛并行互连的网...
以身外身做梦中梦阅读 319评论 0赞 0

西瓜书第五章神经网络
这一章介绍神经网络，从简单单元到简单的神经网络——感知机，再到复杂的多层神经网络的学习算法——BP算法，和一些常见...
起个名字好难阿阅读 1,647评论 0赞 1
吃瓜-TASK04 神经网络/1
1 神经元模型[http://relph.gitee.io/my-team-learning/#/pumpkin_...
f9e1e1f76d8b阅读 603评论 0赞 0
第五章神经网络
神经元模型神经网络：神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实...
尘濯阅读 922评论 0赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文