[神经网络这次真的搞懂了!] (2) 使用神经网络识别手写数字 - sigmoid

英文原文:http://neuralnetworksanddeeplearning.com/
对原文的表达有部分改动

Sigmoid 神经元

学习算法听起来很棒。但是我们如何为神经网络设计这样的算法呢?假设我们有一个感知器网络,我们想用它来学习解决一些问题。例如,网络的输入可能是来自扫描的手写数字图像的原始像素数据。我们希望网络可以通过学习调整权重和偏差,以便网络的输出正确分类数字。为了了解学习如何工作,假设我们对网络中的某些权重(或偏差)进行了小幅更改。我们希望权重的这种微小变化只引起网络输出的微小相应变化。正如我们稍后将看到的,此属性将使学习成为可能。这就是我们想要的(显然这个网络太简单了,无法进行手写识别!):


如果权重(或偏差)的微小变化确实只会导致输出的微小变化,那么我们可以使用这一事实来修改权重和偏差,以使我们的网络以我们想要的方式表现得更好。例如,假设网络错误地将应该是“9”的图像归类为“8”。我们可以通过对权重和偏差进行小的更改,以便网络更接近于将图像分类为“9”。然后我们会重复这个,一遍又一遍地改变权重和偏差,以产生越来越好的输出。

问题在于,当我们的网络包含感知器时,这不会发生。事实上,网络中任何单个感知器的权重或偏差的微小变化有时都会导致该感知器的输出完全翻转,比如从 0 到 1。这种翻转可能会导致网络其余部分的行为以某种非常复杂的方式彻底改变。因此,虽然您的“9”现在可能被正确分类,但网络在所有其他图像上的行为可能已经以某种难以控制的方式完全改变。这使得很难看到如何逐渐修改权重和偏差,才能使网络更接近所需的行为。也许有一些巧妙的方法可以解决这个问题。但我们如何让感知器网络进行学习如今仍并不是很明显。

我们可以通过引入一种称为 sigmoid 神经元的新型人工神经元来克服这个问题。 Sigmoid 神经元类似于感知器,但经过修改后,它们的权重和偏差的微小变化只会导致其输出的微小变化。这是允许 sigmoid 神经元网络能够学习的关键事实。

好的,让我来描述 sigmoid 神经元。我们将以与描绘感知器相同的方式描绘 sigmoid 神经元:


就像感知器一样,sigmoid 神经元有输入,x_1, x_2 ...。但是,这些输入不仅是 0 或 1,还可以采用 0 和 1 之间的任何值。因此,例如,0.638…是 sigmoid 神经元的有效输入。同样就像感知器一样,sigmoid 神经元对每个输入都有权重 w_1, w_2 ...,以及一个整体偏差 b。但输出不是 0 或 1。相反,它是 σ(w⋅x+b)σ 即为 sigmoid 函数,其被定义为
σ(z) \equiv \frac{1}{ 1 + e^{-z}}

更明确地说,具有输入 x_1, x_2 ...,权重 w_1, w_2 ... 和 偏差 b 的 sigmoid 神经元的输出是:
\frac{1}{ 1 + e^{-(\sum_{j} w_jx_j + b)}}

乍一看,sigmoid 神经元与感知器非常不同。如果您还不熟悉 sigmoid 函数的代数形式,它可能看起来不透明且令人生畏。事实上,感知器和 sigmoid 神经元之间有很多相似之处,而且 sigmoid 函数的代数形式更多是技术细节,而不是真正的理解上的障碍。

为了理解与感知器模型的相似性,假设 z = w⋅x+b 是一个很大的正数。那么 e^{−z} ≈ 0,所以 σ(z)≈1。换句话说,当 z = w⋅x+b 很大且为正时,sigmoid 神经元的输出大约为 1,就像感知器一样。另一方面,假设 z = w⋅x+b 是很大且为负时。然后e^{−z}→∞,并且σ(z)≈0。因此,当 z = w⋅x+b 是很大且为负时,sigmoid 神经元的行为也非常接近感知器。只有当 z = w⋅x+b 的大小适中时,才会与感知器模型有很大的偏差。

σ 的代数形式呢?我们怎么能理解呢?事实上,σ 的确切形式并不是那么重要:真正重要的是绘制时函数的形状:


它是阶跃函数的平滑版本:


如果 σ 实际上是一个阶跃函数,那么 sigmoid 神经元将是一个感知器,因为输出将是 1 或 0,这取决于 w⋅x+b 是正还是负。 通过使用实际的 σ 函数,我们得到一个平滑的感知器。 事实上,重要的是 σ 函数的平滑度,而不是它的详细代数形式。 σ 的平滑性意味着权重的微小变化 Δw_j 和偏差的 Δb 会在神经元的输出中产生微小的变化 Δoutput。 事实上,微积分告诉我们 Δoutput 很好地近似为:
\Delta{output} ≈ \sum_{j} \frac{\partial output}{ \partial w_j} * \Delta{w_j} + \frac{\partial output}{ \partial b} * \Delta{b}

w_j\frac{\partial output}{ \partial w_j}\frac{\partial output}{ \partial b} 分别表示 output 相对于 w_j 和 b 的偏导数。虽然上面的表达式看起来很复杂,但包含所有偏导数,它实际上是在说一些非常简单的事情(这是个好消息):\Delta{output} 是权重和偏差中 \Delta{w_j}\Delta{b} 变化的线性函数。这种线性使得选择权重和偏差的微小变化变得容易,以实现输出的任何期望的微小变化。因此,虽然 sigmoid 神经元与感知器具有许多相同的定性行为,但它们更容易弄清楚改变权重和偏差将如何改变输出。

如果真正重要的是 σ 的形状,而不是它的确切形式,那么为什么要使用 σ 的特定形式?事实上,在本系列的后面,我们偶尔会考虑一些其他激活函数。当我们使用不同的激活函数时,主要的变化是上述方程中偏导数的值发生了变化。事实证明,当我们稍后计算这些偏导数时,使用 σ 将简化代数,因为指数在微分时具有可爱的特性。无论如何,σ 常用于神经网络的工作,并且是我们在本系列中最常使用的激活函数。

我们应该如何解释 sigmoid 神经元的输出?显然,感知器和 sigmoid 神经元之间的一大区别是 sigmoid 神经元不只是输出 0 或 1。它们可以输出 0 到 1 之间的任何实数,因此诸如 0.173 和 0.689 之类的值都是合法的输出。例如,假设我们希望网络的输出表明“输入图像是 9”或“输入图像不是 9”。显然,如果输出是 0 或 1,则最容易做到这一点,就像在感知器中一样。但在实践中,我们可以建立一个约定来处理这个问题,例如,决定将大于 0.5 的输出解释为表示“9”,将小于 0.5 的输出解释为“不是 9”。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容