想学好深度学习,没点儿趁手的工具怎么行?

https://www.toutiao.com/a6677459521876525576/


我们身边有越来越多的优秀的工具的出现,它们有助于促进深度学习的复杂过程,使得其更易于访问和提高效率。

每个值得解决的问题都需要很好的支持工具。深度学习也不例外。如果一定要说有什么区别的话,那么可能是在未来的几年,好的工具会边的越来越重要。我们仍然处于深度学习超新星的早期阶段,许多深度学习工程师和爱好者都在以自己的方式进入高效流程。然而,通过观察越来越多的伟大工具,它们有助于促进深度学习的复杂过程,使其更易于访问和提高效率。随着深度学习从研究人员和专家的工作稳步扩展到希望进入该领域(可访问性)的DL爱好者的更广泛领域,以及正在寻求简化其流程并降低复杂性(效率)的不断发展的工程团队,我们汇总了一些最佳DL工具。

深入研究深度学习的生命周期

为了更好地评估可以提高深度学习的可访问性和效率的工具,让我们首先看一下流程的实际情况。

典型(监督)深度学习应用程序的生命周期包括不同的步骤,从原始数据开始,到野外预测结束。

典型的深度学习生命周期

数据来源

任何深度学习应用程序的第一步都是获取正确的数据。有时你很幸运,有历史数据可供使用。有时您需要搜索开源数据集,抓取Web,购买原始数据或使用模拟数据集。由于此步骤通常特定于手头的应用程序,因此我们没有将其包含在工具环境中。但请注意,Google的数据集搜索或Fast.ai数据集等网站可以缓解查找正确数据的问题。

数据标签

大多数受监督的深度学习应用程序处理图像、视频、文本或音频,在训练模型之前,您需要使用地面实况标签来注释这些原始数据,这可能是一项会耗费大量成本且耗时的任务。在理想的设置中,此过程与模型训练和部署交织在一起,并尽可能地利用您训练有素的深度学习模型(即使其性能尚不完美)。

数据版本控制

您的数据随着时间的推移会发展得越多(假设您设置了智能标签流程并随着数据集的增长继续重新训练模型)对数据集进行版本设置就越重要(正如您应该始终对代码和训练模型进行版本更新) 。

扩展硬件

此步骤与模型训练和部署相关:访问正确的硬件。在模型训练期间从本地开发转向大规模实验时,您的硬件需要适当扩展。在部署模型时,根据用户需求进行扩展也是如此。

模型架构

要开始训练模型,您需要选择神经网络的模型架构。

注意:如果您遇到标准问题,这通常意味着只是从开源GitHub存储库复制粘贴最新的可用最先进模型,但有时您会想要亲自动手调整模型的架构以提高性能。使用神经架构搜索(NAS)等新方法,选择正确的模型架构渐渐地归入模型训练阶段,但是对于大多数应用而言,NAS的性能的边际增加不值得增加计算成本。

这一步是人们在考虑编写深度学习应用程序时经常想到的,但正如您所看到的那样,它只是步骤的其中之一,而且往往不是最重要的。

模型训练

在模型训练期间,您将标记数据提供给神经网络,并迭代更新的模型权重,以最大限度地减少训练集的损失。一旦选择了一个指标(参见模型评估),您就可以在称为超参数调整的过程中使用许多不同的超参数集(例如,学习速率、模型架构和一组预处理步骤的组合)来训练您的模型。

模型评估

如果你无法区分好的和坏的模型,那么训练神经网络就没有意义了。在模型评估期间,您通常会选择一个指标进行优化(同时可能会观察到许多其他指标)。对于此指标,您尝试查找从训练数据到验证数据的最佳表现模型。这涉及跟踪不同的实验(可能有不同的超参数、体系结构和数据集)及其性能指标,可视化训练模型的输出,并将实验相互比较。如果没有合适的工具,这可能会很快变得混乱和复杂,尤其是在与同一个深度学习管道上的多个工程师协作时。

模型版本控制

最终模型评估和模型部署之间的一小步(但仍值得一提):使用不同版本标记模型。当您发现最新的型号版本达不到您的期望时,这使您可以轻松回滚到运行良好的型号版本。

模型部署

如果您有一个您希望投入生产的模型版本,则需要以您的用户(可以是人员或其他应用程序)可以与您的模型通信的方式进行部署:使用数据发送请求并返回模型的预测。理想情况下,您的模型部署工具支持在不同模型版本之间逐步切换,以便您可以预测在生产中使用新模型的效果。

监测预测

部署完模型后,您需要密切关注它在现实世界中的预测,并在用户敲门抱怨您的服务之前,收到有关数据分布变化和性能下降的警报。

注意:该流程图已经暗示了典型深度学习工作流程的循环性质。实际上,在深度学习工作流程中将部署模型和新标签之间的反馈循环视为一流公民,这可能是许多应用程序最重要的成功因素之一。在现实生活中的深度学习工作中,事情通常比流程图所暗示的更复杂。您将发现自己跳过步骤(例如,当您使用预先标记的数据集时),返回几个步骤(模型性能不够准确,您需要获取更多数据)或在疯狂循环中来回(架构=>训练=>评估=>训练=>评估=>架构)。

我们最喜爱的深度学习工具

在Luminovo,我们努力创造工具,使我们的工程师更高效,并利用那里出色的深度学习人员创建的强大工具。伟大的代码意味着共享,因此下面的图表概述了目前市场上最有前途的深度学习工具。来自DL工程师的DL工程师和所有热衷于了解更多关于创建令人敬畏的深度学习应用程序的人。

详细内容可以点击了解:https://drive.google.com/file/d/1XhngKISDpQgwGlvU-hjXWZb_qfyIYjqN/view

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容