「自然语言处理（NLP）」入门系列（二）什么才是真正的深度学习？

来源：AINLPer微信公众号
编辑: ShuYini
校稿: ShuYini
时间: 2020-01-08

本次主要内容:
1、深度学习（DL）与机器学习（ML）之间的联系。
2、利用深度学习（DL）做自然语言处理(NLP)的优势。

深度学习（DL）是机器学习（ML）的关系？

深度学习（DL）是机器学习（ML）的一个分支，但是他们之间的不同是哪些呢？

机器学习是基于数据的。大多数机器学习依赖于人类来识别和描述数据集的特定特征。例如，数据科学家构建一个机器学习解决方案来识别文本中的地名，可以使用代码来描述要查找的特定特征，比如:

1、目标单词的大小写
2、目标单词的左边和右边的单词
3、目标单词中的特定子字符串，通常表示公司或人员
4、目标单词中的连字符
等等。

一个典型的机器学习解决方案最终会有成千上万甚至上百万的手工设计的特性。那么，一旦人类手工完成了所有这些特征识别工作，机器还能做什么呢?在这种类型的解决方案中，机器的工作主要是使用一个学习算法来调整每个特征的权重，以优化预测精度。计算机非常擅长这种数值优化，但这些解决方案仍然严重依赖于人类对问题的思考和学习。

那么，我们怎样才能在不需要太多人工干预的情况下，帮助机器自己学习呢?我们可以使用表征学习。在表示学习中，计算机自己识别数据中的特征，而不需要人工描述要查找的内容。

表示学习的简单形式包括你可能在介绍性机器学习材料中看到的东西。集群算法，像k-means和期望最大化，是一种表示学习，它获取未标记的数据并寻找模式将其分组到集群中。维数约简是一种将具有大量维数的数据“扁平化”为更少维数的算法，也是表示学习的一个好例子。

深度学习是建立在这个理念上的，通过使用多层的学习表征来创建一个人类大脑式的系统，这个系统的表现优于其他学习方法。通过深度学习，您将一个大型数据集输入到一个模型中，该模型将生成一个可学习的表示。然后，模型将学习到的表示输入到另一个算法层，该算法层使用输入数据生成新的学习到的表示。根据模型的“深度”，对于给定的层数，模型会一遍又一遍地重复这种模式。每个后续层使用前一层的输出作为其数据，然后从该输入生成自己的学习表示。在图表中，它看起来是这样的。

深度学习分成结构图

这种分层结构产生了一个网络。在这个更大的分层表示的前提下，有几个系列的深度学习模型。在目前的实践中，深度学习大多使用神经网络。就像人工智能一样，深度学习是一个新闻和流行文化经常误用的术语。不要被那些将深度学习作为与智能计算机相关的术语的文章所愚弄!如果你不是在讨论神经网络或分层学习表示，很可能它不是深度学习。

为什么要使用深度学习？

深度学习是一种令人兴奋的自然语言处理技术。以前使用手工设计的特性进行自然语言处理的尝试常常过于详细和不完整。他们也花了很长时间来验证和改进。深度学习相对来说是快速和灵活的，足以快速适应新的数据。这种方法避免了手工设计特性的漫长设计和验证周期。

由于深度学习允许计算机自己构建数据特性，因此它是学习各种信息的一个几乎通用的框架。这包括关于世界的语言信息、视觉信息和上下文信息。

但探索自然语言处理的深度学习的最佳理由是，它是有效的，而且比研究人员尝试过的其他技术有效得多。自从2010年左右自然语言处理首次取得成功以来，深度学习已经取得了巨大的进步。然而，深度学习的基本技术最早出现在20世纪80年代和90年代。那么，为什么我们只是在过去10年才开始探索它们呢?

首先，可能也是最重要的，我们现在拥有的数据比80年代和90年代多得多。互联网的普及和普及意味着我们已经收集了关于几乎所有事情的空前数量的数据，从我们购买的产品到我们如何社交。互联网是由大量的语言数据样本组成的，包括来自Twitter和博客等来源的随意讲话。当涉及到机器学习，尤其是深度学习时，拥有大量的数据集是关键。

与此同时，出现了更快的机器和多核cpu和gpu，这有助于支持深度学习所需的计算能力。特别是，深度学习非常适合并行处理，它现在特别便宜和高效。

最后，新的模型、算法和思想使深度学习更加有效和灵活。这包括更好、更灵活的中间表示学习，更有效的使用上下文和任务间转移的学习方法，以及更有效的端到端联合系统学习。

ACED

Attention

更多自然语言处理相关知识，还请关注AINLPer公众号，极品干货即刻送达。

最后编辑于：2020.01.18 00:06:23

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 213,558评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,002评论 3赞 387
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 159,036评论 0赞 349
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,024评论 1赞 285
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,144评论 6赞 385
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,255评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,295评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,068评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,478评论 1赞 305
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,789评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,965评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,649评论 4赞 336
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,267评论 3赞 318
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,982评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,223评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,800评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,847评论 2赞 351

「自然语言处理（NLP）」入门系列（二）什么才是真正的深度学习？

深度学习（DL）是机器学习（ML）的关系？

为什么要使用深度学习？

ACED

Attention

推荐阅读更多精彩内容