The Next Step for Machine Learning 机器学习落地需攻破的9个难题

机器学习在前两年的时间里，一下子就爆火了起来。很多公司也跟着这个趋势，招募了很多算法工程师、数据挖掘工程师。但是，在实践中，企业发现要落地，实际上还有很多问题需解决。以至于在大部分项目，还是规则主导。算法工程师的日常，也不过是清洗数据，调整规则。所以，机器学习技术，在真实的应用中到底缺少些什么呢？

在国立台湾大学《机器学习》2019春季班，李宏毅老师给出了他的观察。以下的内容，结合李老师的最新讲义、加上我本身工作的理解，给大家梳理机器学习落地急需解决的9个难题。

拒绝回答与可解释性（哲学层面）

1. Anomaly Detection 机器能不能知道“我不知道”

机器能不能知道自己的识别范围，还是说生硬地给出模型内的东西，或者说抛出无法识别。在猫狗分类里，现有的模型已经到达很高的精度，甚至能给出猫狗的品种。

Cat.png

但是正式上线后，用户真的会乖乖给到猫狗的图片吗？如果用户丢一张妹子图，机器能够知道自己不知道吗？目前这个领域的研究叫做 Anomaly Detection。知道自己不知道，对于一些异常的情况，十分重要。

2. Explainable AI 说出为什么“我知道”

神马汉斯的故事：

18世纪德国，一匹名叫汉斯的马成为当地网红。他能够计算简单的算术题，并用蹄子敲出正确回答。这在当时一度引起轰动。后来，有人做了个实验，把汉斯和周围的人完全隔绝，这匹马就完全蒙圈了。时事证明，这匹马的神奇能力不在于他的算数能力，而在于他的观察能力。当给到正确答案时，周围的人会有不一样的反应，汉斯也就随即停止敲马蹄。

机器学习的成果，是否同汉斯一样，通过一些意想不到的渠道，获得的答案。在 GCPR 2017 Tutorial 的研究中，研究者通过注意力机制，研究机器判断的依据。

GCPR2017.jpg

实验者测试了两个模型，两个模型均为马匹识别。DNN 模型的焦点集中在马匹身上，是一个正常的模型。但 FV 的交点却集中在图片左下角。原来，图片的左下角有图片的出处，所有的包含马匹的图都有这个标记。所以，FV 模型学到的重点在于这些标记。同样的表现，却是不一样的判断依据。显然，FV 模型的判断依据是滑稽和不可靠的。

我们需要一些技术，让 AI 不仅给出结果，同时要给出判断的依据。即：模型的可解释性。

抵御恶意攻击

3. 防止 Adversarial Attack

人有错觉，机器是否也会有错觉。我们来做一个认知实验。以下两个圈圈，哪个的颜色更深？好，记住你的答案。结果将在稍后揭晓。

mistake.jpg

对于机器，有研究表明，通过改变图像中的个别像素，可以起到迷惑机器的作用。改变一个像素，就可以让模型的判断结果从熊猫到长臂猿。该技术名叫 Adversarial Attack。

m_mistake.jpg

这样的技术相当危险。举个例子，当自动驾驶的车辆行驶在路上时，可能路边的人挥舞下旗子，机器的判断就会被干扰，做出不当的举动。

回到开头的例子，正确答案是左边。这其实是一个计中计。你以为这是视觉认知实验，其实这也是某种形式的“心理攻击”。

mistake_2.jpg

学习模式

4. Life-long learning 终身学习

终身学习是一个人类行为的概念。活到老学到老，大家都知道只有不断更新自己的知识，才能跟上社会发展的步伐。同时呢，先前学到的东西，对后面的学习仍有帮助。举个例子：学完线性代数之后，对学习和理解机器学习就大有帮助。

但是，机器不一样。今天的我们，一般只让一个模型学习一个任务。但这样会存在一些问题。首先是随着建模的增多，模型数量将无限增长。其次，模型之前学到的技能，对之后的学习没有帮助。就像 Alphastar 它玩星际争霸很棒，但让他同时学下围棋，目前来说是不行的。它和 Alphazero 是两个不同的模型。

那么，自然而然的，我们就会抛出这样一个疑问，机器能否终身学习呢？这里的相关研究，提个关键词 Catastrophic Forgetting 。

5. Meta-learning / Learn to learn 学习如何学习

现有的机器学习模型设计，都遵循着这样一个范式——在特定领域人工设计一套算法，让机器去学习。我们就想，能不能设计一套算法，让机器自己去设计自己的学习算法呢？

这样的范式，我们称之为 meta-learning 元学习，或者叫 learn to learn，学习如何学习。

模型改进

6. Reinforcement learning 增强学习为什么这么慢

现在撸模型，没用上增强学习，都不好意思说出来。在像星际争霸这样的游戏中，增强学习确实有用。但是，它真的有那么强吗？

在星际争霸中，机器花了900小时，才到达4000分左右。而人类的能力在哪儿呢？人类只需要2小时，就能到达。像前面提到的Alphastar，它虽然在星际争霸上能够痛扁人类，但它可是花了200年的时间在玩这个游戏。模型世界就像是修仙小说里的精神世界。若是把一个人丢在里面，只能玩星际争霸，他其实也可以达到机器的水平，更可能比机器做得更好。增强学习为什么这么慢，能不能再快些？

Alphastar.png

7. Network Compression 神经网络压缩

机器学习目前多运行在大型服务器上，配备极强的 GPU、相当大的内存和数目众多的 CPU。但若想要把机器学习广泛应用于生活中，IoT 物联网这类设备的计算和存储都是十分有限的。我们能不能把模型缩小，同时保留其能力呢。我们能不能把大型神经网络进行剪枝，或者是参数二元化，以此来减轻内存和计算压力呢。我们现在有 tensorflow lite，有 coreML，但这些还不够。

训练数据

8. Few-shot / Zero-shot learning 一定需要很多训练数据吗

做比赛、写论文的都知道，要想效果好，数据少不了。数据质量很大程度决定了结果的表现。但是在实际生产环境中，带标注的优质数据是极其稀少的。这个时候，老板想让你做一个异常游戏玩家的识别，数据样本又很少，你该怎么办？除去自己手工标注、请人标注、做数据扩增外，我们还有很没有别的办法。难道要跟老板摊牌，说做不了这一个任务吗？

现实场景的样本之少，一直有在困惑我们一线的员工。现在我们就希望，模型能够通过少量的样本，扩展到大量的未标记数据。这样的研究有，我们称之为 Few-shot learning。更有甚至，模型能不能通过我对川菜的描述：麻辣、重油、就识别出桌上的饭菜是四川菜呢？这样的模型被称之为 Zero-shot learing，不需要样本进行学习。

caption.jpg

9. 机器学习的谎言训练数据和测试数据很不一样

当我们在学习机器学习各类算法时，教科书都会有这样一个假设：训练数据和测试数据拥有相同的分布。但在真实世界中，这就是个谎言。

train-test.jpg

以手写数字识别为例，当训练集和测试集同分布时，你可以轻松达到99%的正确率。但在真实生活中，你的老板可能会给你右边的任务。训练数据是黑白的，实际场景中背景却是彩色的。这里你有两个选择：一是把《机器学习》这本数仍到老板面前，告诉他书上写的要求同分布，你这个任务做不了。但是一想到你家里的老婆孩子，你可能还是会含泪接下这个任务。仔细想想，若是模型真的识别到数字的形状，背景色应该没有关系吧。但是当你真正来做这件事时，你会发现，同样的模型，正确率下降到了57.5%。

train-test-2.jpg

诸如此类的问题，在真实场景中很常见。实际工作中，我们也有采取一些措施，尽量避免分布不同步的情况发生。

总结

李宏毅老师以上的总结，在生产环境确实存在。这也是我把它梳理一遍的动机，希望所有从业者在工作中能够注意到它们，在这些问题上有所突破。看完本文的读者，别忘了点赞、评论、喜欢+关注哦。你的鼓励，是我下一步的动力。

原文首发链接

最后编辑于：2019.02.27 08:32:51

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 213,558评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,002评论 3赞 387
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 159,036评论 0赞 349
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,024评论 1赞 285
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,144评论 6赞 385
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,255评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,295评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,068评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,478评论 1赞 305
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,789评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,965评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,649评论 4赞 336
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,267评论 3赞 318
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,982评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,223评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,800评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,847评论 2赞 351