吴恩达 深度学习课程

为什么深度学习会兴起?

如果深度学习和神经网络背后的基本技术理念已经有好几十年,为什么现在才突然兴起?

  • 数据量的急剧增加
  • 更快的计算能力
  • 神经网络算法的创新

下面我们将介绍深度学习流行起来的主要因素,这会帮助你更好地运用到工作中去。
我们首先来画一张图:


传统机器学习算法.jpg

水平轴代表完成任务的数据数量,垂直轴代表机器学习算法的性能,比如垃圾邮件过滤的准确率、广告点击预测的准确率,或是用于无人驾驶中判断其他车辆位置的神经网络的准确率。
根据图像可以发现,把传统机器学习算法的表现,比如说支持向量机,或logistics回归 作为数据量的一个函数。它的性能在刚刚开始的时候,会随着数据量的增加而上升,但是过一段时间之后,它的性能进入平台期,这是因为这些模型无法处理海量数据

数据量急剧增加

而在过去20年中,我们遇到的很多问题,只有相对较少的数据量。而现在,是一个数据化的社会,收集海量的数据变得轻而易举。

  1. 人们花了越来越多的时间在网络上,而所有的这些活动都能创造数据,
  2. 一些硬件:相机、电话、加速器以及物联网中的各种传感器,也使我们收集到了越来越多的数据。

过去20年来收集到的海量数据,远超传统学习算法能发挥作用的规模。对于神经网络模型,训练不同规模的神经网络,他们的性能也会不一样。一个中等规模的神经网络,它的性能表现也会更好一些。越大的神经网络,其性能表现越来越好。如图所示:

规模推动深度学习的进步.jpg

为了使这个图从技术上更准确一点,X轴的数据量,准确来说应该是“带标签的数据”量。
带标签的数据,在训练样本时,我们会输入变量X和变量Y。
使用小写字母m,表示样本集的规模,或者训练样本的数量。

在样本集规模不大的情况下,各种算法的性能的差异是不大的,难以比较。它的效果取决于人工设计的组件。假设有些人训练出了一个SVM, 可能是因为人工设计的组件很厉害。有些人训练的规模会大一些,可能训练集不大的时候,SVM表现更好。在这个图形区域的左边,各种算法之间的优劣不是很明显。最终的性能,更多取决于人工设计组件的技能,以及算法处理的一些细节。
只有在大数据领域,非常庞大的训练集,也就是在右边,m非常大时,我们才能见到,神经网络稳定地领先于其他算法。

如果你想达到那么高的性能水平,注意两点:
1. 训练规模足够大的神经网络,以发挥巨大规模数据量的优点。
2. 要有足够的数据量(规模一直在推动深度学习的进步)
提升这两者的规模,使我们在深度学习领域取得了较大的进展。

更快的计算能力

神经网络算法的创新

可以这么说,在初期,是数据和计算能力规模的发展促进了深度学习的崛起。但是渐渐地,尤其是在最近这几年我们也见证了算法方面的极大创新。我不想忽略算法方面的巨大贡献。

  • 有趣的是,许多算法上的创新,都是为了让神经网络运行得更快,举一个例子,神经网络方面的一个巨大突破是,从sigmoid函数,转换到这样的ReLU函数,


    image.png

    如果你无法理解刚才我说的某个细节,也不要担心,但是使用sigmoid函数的机器学习问题是,在这个区域,sigmoid函数的斜率会接近0,所以学习会变得非常缓慢,而通过改变函数,当神经网络用ReLU函数——修正线性单元ReLU,它的斜率是1,对于所有的正值的输入、输出都是1,因此梯度不会逐渐趋向0。我们发现,只需将sigmod函数转换成ReLU函数,便能够使得“梯度下降法”运行得更快。这是一个简单的算法创新的小例子,但是最终算法创新所带来的影响,是增加计算速度。
    有很多像这样的例子,我们通过改变算法,使得代码运行更快,这也使得我们能够训练更大规模的神经网络,即使在数据量很大的情况下,也能在规定时间内完成计算。

  • 快速计算另一个很重要的原因是:训练神经网络的过程,很多时候是凭直觉的。当你有了关于神经网络架构的想法,于是你写代码实现你的想法,然后运行一下代码,来检验你的神经网络效果有多好,知道结果之后再回去修改。去改你的神经网络中的一些细节。然后你不断重复这个循环。


    image.png

    当你的神经网络需要很长时间去训练,需要很长时间才能走完一圈循环的话,在实现神经网络时,迭代速度对你的效率影响巨大。有些人可能需要10分钟便可得到结果,而有些人可能需要一个月,如果你只需要10分钟得到结果,那么你就可以尝试更多的想法,那你就更可能发现适合你的应用的神经网络。所以计算速度的提升,真的有帮助提高迭代速度,让你更快地得到实验结果。这也同时帮助了神经网络的从业人员,和有关项目的研究人员,在深度学习的工作中,迭代得更快。

所有这些都极大推动了整个深度学习社区的研究,快到令人难以置信。人们一直在发明新的算法,持续不断地进步。是这些力量支持了深度学习的崛起。而这些力量还在不断发挥作用。让深度学习更进一步。
数据: 我们的社会还在产生更多的数字化数据
计算:GPU这类专用硬件还在继续发展、网络和各种硬件的速度变得更快,我很有信心我们实现超级大规模神经网络的能力。或者从计算能力这个角度看,也在继续进展。
算法:我希望深度学习研究社区能在算法上持续创新。
基于这些,我们可以乐观地回答,深度学习还会继续进步很多年。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容

  • 文章主要分为:一、深度学习概念;二、国内外研究现状;三、深度学习模型结构;四、深度学习训练算法;五、深度学习的优点...
    艾剪疏阅读 21,834评论 0 58
  • 原文地址:http://www.cnblogs.com/subconscious/p/5058741.html 神...
    Albert陈凯阅读 5,447评论 0 48
  • 一、我为什么参加复训? 我对复训的价值的深刻认识来源于马丁老师的给父母打电话的故事,第三次参加课程才让他突破自己。...
    创富研习社阅读 122评论 0 1
  • 对咖啡并没有特殊的感情,也不知道如何去品鉴。自从上次在墨城喝到了自认为最好喝的咖啡,便想在这边自己试着泡咖啡喝...
    童雅阅读 321评论 0 2
  • 1.CentOS 6网卡名称 (1)接口命名方式:CentOS 6 (2) 网络接口识别并命名相关的udev配置文...
    尛尛大尹阅读 3,598评论 0 3