机器学习之softmax函数

在上一篇专题中,我们以三层神经网络的实现为例,介绍了如何利用Python和Numpy编程实现神经网络的计算。其中,中间(隐藏)层和输出层的激活函数分别选择了 sigmoid函数和恒等函数。此刻,我们心中不难发问:为什么要花一个专题来介绍输出层及其激活函数?它和中间层又有什么区别?softmax函数何来何去?下面我们带着这些疑问进入本专题的知识点:

1 输出层概述

2 回归问题及恒等函数

3 分类问题及softmax函数

4 Python编程softmax函数

1 输出层概述

神经网络/深度学习本质上都属于机器学习问题,而我们知道,机器学习一般分为监督学习和非监督学习,生活中,我们应用更多的是监督学习(简单来说需要事先通过已知的输入输出数据进行学习,然后对未知的输入数据进行预测),以神经网络为例,学习的结果,即输出层的输出值y。该输出值既可以是一个连续的无范围约束的数值(回归问题),也可以是一个离散的范围被限制(一般在0至1之间)的数值(分类问题)。所以针对不同的问题,我们对输出层的设计,即激活函数的设计应不同。一般情况下,在神经网络中,回归问题选择恒等函数作为激活函数,分类问题选择softmax函数作为激活函数。

小提示:

监督学习又分为回归问题和分类问题。如果想对机器学习有一个透彻而全面的理解,给大家推荐一本OReilly出版的书籍《Introduction to MachineLearning with Python》,不知道现在是否发布了中文版,但网上已经有了很多读者自己上传的中文笔记,大家也可在我的博客中获取本人上传的阅读笔记。

2 回归问题及恒等函数

“回归”一词对于理工科的人来说并不陌生,直观地讲,回归问题是根据输入来预测一个连续的数值的问题。比如根据一个人的日常饮食量来预测这个人的体重,这就是一个回归问题。为让大家更加明白,我们以数学表达式为例:

上面这个回归问题,以神经网络模型为例,首先需要向神经网络提供已知的正确的输入(食饭量和食肉量)和输出(体重),通过这些信息,模型学到了变量的权重。然后就可以对输入进行输出预测。

不难理解,我们并不需要对这样的信号加权和进行其他处理,也就是说我们直接输出食饭量和食肉量的加权和即可。因此,在输出层的设计中,输入信号应该原封不动地被输出,即激活函数h()应该选择恒等函数(用σ()表示),如下图:

由于激活函数选择的是恒等函数,因此输出值没有在我们的预定范围内。

3 分类问题及softmax函数
3.1 分类问题

顾名思义,“分类”就是判断一个数据集所描述的类别,比如判断图像中的人是男还是女,这里的数据集是图像数据,类别有男和女两个类别。既然是判断,那么它应该是一个概率性的问题,打个比方,一个画了浓妆艳抹的男扮女装,仅看照片,我们为了防止说话过于绝对,会以这样的方式表达:我觉得这照片有可能是男的;我觉得这照片很有可能是男的。以概率描述:我觉得这张照片是男性的可能性为60%(0.6);我觉得这张照片是男性的可能性是90%(0.9)。

因此,我们对分类问题的判断结果,实际上是来自于概率。我们用上图来分析分类问题:图中的输出信号有三个y1、y2、y3,我们可以理解为这是一个三类别分类,对于输入的数据集,神经网络通过计算后得到值y1、y2、y3。这三个值的大小都应该在0至1之间,且它们的和应该为1。对于一个输入来说,神经网络预测的结果就是y1、y2、y3中最大值所对应的类别。比如y1、y2、y3的值分别为0.2、0.7、0.1,那么神经网络对这个输入的预测结果就是类别“乙”。

3.2 softmax函数

通过上面的分析,回归问题我们只需将输出层的输入信号原封不动地输出即可,而分类问题我们需要考虑两个问题:

(1)每个输出信号值在0至1之间。

(2)所有输出信号的和为1。

基于以上要求,分类问题中,输出层的激活函数常用softmax函数:

exp(x)表示ex的指数函数,ak是输出层中第k个输入信号,exp(ak)表示ak的指数函数。分母表示输出层共有n个输出信号(神经元),并计算所有输出层中的输入信号的指数和。yk是第k个神经元的输出。

仔细分析,该函数实际上等同于一个求占比的公式,读者可验证,信号加权和经softmax函数处理后完全满足上面两点要求。可以说,softmax函数很普通,只需完成指数运算、求和运算、除法运算。

顾名思义,“分类”就是判断一个数据集所描述的类别,比如判断图像中的人是男还是女,这里的数据集是图像数据,类别有男和女两个类别。既然是判断,那么它应该是一个概率性的问题,打个比方,一个画了浓妆艳抹的男扮女装,仅看照片,我们为了防止说话过于绝对,会以这样的方式表达:我觉得这照片有可能是男的;我觉得这照片很有可能是男的。以概率描述:我觉得这张照片是男性的可能性为60%(0.6);我觉得这张照片是男性的可能性是90%(0.9)。

因此,我们对分类问题的判断结果,实际上是来自于概率。我们用上图来分析分类问题:图中的输出信号有三个y1、y2、y3,我们可以理解为这是一个三类别分类,对于输入的数据集,神经网络通过计算后得到值y1、y2、y3。这三个值的大小都应该在0至1之间,且它们的和应该为1。对于一个输入来说,神经网络预测的结果就是y1、y2、y3中最大值所对应的类别。比如y1、y2、y3的值分别为0.2、0.7、0.1,那么神经网络对这个输入的预测结果就是类别“乙”。

3.2 softmax函数

通过上面的分析,回归问题我们只需将输出层的输入信号原封不动地输出即可,而分类问题我们需要考虑两个问题:

(1)每个输出信号值在0至1之间。

(2)所有输出信号的和为1。

基于以上要求,分类问题中,输出层的激活函数常用softmax函数:

exp(x)表示ex的指数函数,ak是输出层中第k个输入信号,exp(ak)表示ak的指数函数。分母表示输出层共有n个输出信号(神经元),并计算所有输出层中的输入信号的指数和。yk是第k个神经元的输出。

仔细分析,该函数实际上等同于一个求占比的公式,读者可验证,信号加权和经softmax函数处理后完全满足上面两点要求。可以说,softmax函数很普通,只需完成指数运算、求和运算、除法运算。

4 Python编程softmax函数

我们已经知道了y1、y2、y3都会有一个0至1之间的数值。而最后的分类结果则取决于这三个值中最大值所对应的类别。借助numpy的广播功能就能轻松实现这样的操作。在这之前,我们需要考虑一个数值过大(溢出)的问题:softmax需要计算指数和,比如当ak中的某个值为1000时,其指数将是无穷大,由于计算机处理数值位数有限,因此有可能无法进行指数或求和运算。

为了解决这个潜在问题,我们对softmax函数作一下处理:


image.png

公式表明在进行softmax的指数运算时,加上某个常数不会改变运算的结果。为了防止结果值溢出,一般会使用输入信号中的最大值的负数为这个常数,Python编程代码如下:


import numpy as np
def softmax(a):
    c=np.max(a) #求数组中的最大值
    exp=np.exp(a-c)  #指数运算
    sum_exp=np.sum(exp) #指数求和
    y=exp/sum_exp        #softmax函数值
    return y
"""测试"""
a=np.array([0.4,5,3])
y=softmax(a)
print(y)  #输出[0.00877593 0.87306727 0.11815681]

程序是不是很简单?是的,在上一专题讲过的三层神经网络实现的代码中只需将恒等函数equal_function()替换为softmax()函数即可。softmax函数的输出是0到1,且输出值的总和为1,因此把softmax函数的输出概率解释为“概率”。一般而言,神经网络只把输出值最大的神经元所对应的类别作为识别结果。比如测试代码中计算得到y的输出最大值为y[1]=0.87,因此对于这个输入数据而言,预测的分类为“乙类”,也可以说有87%的概率认为预测结果为“乙类”。

总结一下,这个专题介绍了输出层及其激活函数、回归问题、分类问题、恒等函数和softmax函数。在介绍这些知识点的过程中,我们始终以预测结果为背景展开的,因此阅读完这篇文章,读者应该对机器学习或者神经网络的预测的流程有一定了解。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352

推荐阅读更多精彩内容