The Next Step for Machine Learning 机器学习落地需攻破的9个难题

机器学习在前两年的时间里,一下子就爆火了起来。很多公司也跟着这个趋势,招募了很多算法工程师、数据挖掘工程师。但是,在实践中,企业发现要落地,实际上还有很多问题需解决。以至于在大部分项目,还是规则主导。算法工程师的日常,也不过是清洗数据,调整规则。所以,机器学习技术,在真实的应用中到底缺少些什么呢?

在国立台湾大学《机器学习》2019春季班,李宏毅老师给出了他的观察。以下的内容,结合李老师的最新讲义、加上我本身工作的理解,给大家梳理机器学习落地急需解决的9个难题。

拒绝回答与可解释性(哲学层面)

1. Anomaly Detection 机器能不能知道“我不知道”

机器能不能知道自己的识别范围,还是说生硬地给出模型内的东西,或者说抛出无法识别。在猫狗分类里,现有的模型已经到达很高的精度,甚至能给出猫狗的品种。

Cat.png

但是正式上线后,用户真的会乖乖给到猫狗的图片吗?如果用户丢一张妹子图,机器能够知道自己不知道吗?目前这个领域的研究叫做 Anomaly Detection。知道自己不知道,对于一些异常的情况,十分重要。

2. Explainable AI 说出为什么“我知道”

神马汉斯的故事:

18世纪德国,一匹名叫汉斯的马成为当地网红。他能够计算简单的算术题,并用蹄子敲出正确回答。这在当时一度引起轰动。后来,有人做了个实验,把汉斯和周围的人完全隔绝,这匹马就完全蒙圈了。时事证明,这匹马的神奇能力不在于他的算数能力,而在于他的观察能力。当给到正确答案时,周围的人会有不一样的反应,汉斯也就随即停止敲马蹄。

机器学习的成果,是否同汉斯一样,通过一些意想不到的渠道,获得的答案。在 GCPR 2017 Tutorial 的研究中,研究者通过注意力机制,研究机器判断的依据。

GCPR2017.jpg

实验者测试了两个模型,两个模型均为马匹识别。DNN 模型的焦点集中在马匹身上,是一个正常的模型。但 FV 的交点却集中在图片左下角。原来,图片的左下角有图片的出处,所有的包含马匹的图都有这个标记。所以,FV 模型学到的重点在于这些标记。同样的表现,却是不一样的判断依据。显然,FV 模型的判断依据是滑稽和不可靠的。

我们需要一些技术,让 AI 不仅给出结果,同时要给出判断的依据。即:模型的可解释性。

抵御恶意攻击

3. 防止 Adversarial Attack

人有错觉,机器是否也会有错觉。我们来做一个认知实验。以下两个圈圈,哪个的颜色更深?好,记住你的答案。结果将在稍后揭晓。

mistake.jpg

对于机器,有研究表明,通过改变图像中的个别像素,可以起到迷惑机器的作用。改变一个像素,就可以让模型的判断结果从熊猫到长臂猿。该技术名叫 Adversarial Attack。

m_mistake.jpg

这样的技术相当危险。举个例子,当自动驾驶的车辆行驶在路上时,可能路边的人挥舞下旗子,机器的判断就会被干扰,做出不当的举动。

回到开头的例子,正确答案是左边。这其实是一个计中计。你以为这是视觉认知实验,其实这也是某种形式的“心理攻击”。


mistake_2.jpg

学习模式

4. Life-long learning 终身学习

终身学习是一个人类行为的概念。活到老学到老,大家都知道只有不断更新自己的知识,才能跟上社会发展的步伐。同时呢,先前学到的东西,对后面的学习仍有帮助。举个例子:学完线性代数之后,对学习和理解机器学习就大有帮助。

但是,机器不一样。今天的我们,一般只让一个模型学习一个任务。但这样会存在一些问题。首先是随着建模的增多,模型数量将无限增长。其次,模型之前学到的技能,对之后的学习没有帮助。就像 Alphastar 它玩星际争霸很棒,但让他同时学下围棋,目前来说是不行的。它和 Alphazero 是两个不同的模型 。

那么,自然而然的,我们就会抛出这样一个疑问,机器能否终身学习呢?这里的相关研究,提个关键词 Catastrophic Forgetting 。

5. Meta-learning / Learn to learn 学习如何学习

现有的机器学习模型设计,都遵循着这样一个范式——在特定领域人工设计一套算法,让机器去学习。我们就想,能不能设计一套算法,让机器自己去设计自己的学习算法呢?

这样的范式,我们称之为 meta-learning 元学习,或者叫 learn to learn,学习如何学习。

模型改进

6. Reinforcement learning 增强学习为什么这么慢

现在撸模型,没用上增强学习,都不好意思说出来。在像星际争霸这样的游戏中,增强学习确实有用。但是,它真的有那么强吗?

在星际争霸中,机器花了900小时,才到达4000分左右。而人类的能力在哪儿呢?人类只需要2小时,就能到达。像前面提到的Alphastar,它虽然在星际争霸上能够痛扁人类,但它可是花了200年的时间在玩这个游戏。模型世界就像是修仙小说里的精神世界。若是把一个人丢在里面,只能玩星际争霸,他其实也可以达到机器的水平,更可能比机器做得更好。增强学习为什么这么慢,能不能再快些?

Alphastar.png

7. Network Compression 神经网络压缩

机器学习目前多运行在大型服务器上,配备极强的 GPU、相当大的内存和数目众多的 CPU。但若想要把机器学习广泛应用于生活中,IoT 物联网这类设备的计算和存储都是十分有限的。我们能不能把模型缩小,同时保留其能力呢。我们能不能把大型神经网络进行剪枝,或者是参数二元化,以此来减轻内存和计算压力呢。我们现在有 tensorflow lite,有 coreML,但这些还不够。

训练数据

8. Few-shot / Zero-shot learning 一定需要很多训练数据吗

做比赛、写论文的都知道,要想效果好,数据少不了。数据质量很大程度决定了结果的表现。但是在实际生产环境中,带标注的优质数据是极其稀少的。这个时候,老板想让你做一个异常游戏玩家的识别,数据样本又很少,你该怎么办?除去自己手工标注、请人标注、做数据扩增外,我们还有很没有别的办法。难道要跟老板摊牌,说做不了这一个任务吗?

现实场景的样本之少,一直有在困惑我们一线的员工。现在我们就希望,模型能够通过少量的样本,扩展到大量的未标记数据。这样的研究有,我们称之为 Few-shot learning。更有甚至,模型能不能通过我对川菜的描述:麻辣、重油、就识别出桌上的饭菜是四川菜呢?这样的模型被称之为 Zero-shot learing,不需要样本进行学习。

caption.jpg

9. 机器学习的谎言 训练数据和测试数据很不一样

当我们在学习机器学习各类算法时,教科书都会有这样一个假设:训练数据和测试数据拥有相同的分布。但在真实世界中,这就是个谎言。

train-test.jpg

以手写数字识别为例,当训练集和测试集同分布时,你可以轻松达到99%的正确率。但在真实生活中,你的老板可能会给你右边的任务。训练数据是黑白的,实际场景中背景却是彩色的。这里你有两个选择:一是把《机器学习》这本数仍到老板面前,告诉他书上写的要求同分布,你这个任务做不了。但是一想到你家里的老婆孩子,你可能还是会含泪接下这个任务。仔细想想,若是模型真的识别到数字的形状,背景色应该没有关系吧。但是当你真正来做这件事时,你会发现,同样的模型,正确率下降到了57.5%。

train-test-2.jpg

诸如此类的问题,在真实场景中很常见。实际工作中,我们也有采取一些措施,尽量避免分布不同步的情况发生。

总结

李宏毅老师以上的总结,在生产环境确实存在。这也是我把它梳理一遍的动机,希望所有从业者在工作中能够注意到它们,在这些问题上有所突破。看完本文的读者,别忘了点赞、评论、喜欢+关注哦。你的鼓励,是我下一步的动力。

原文首发链接

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容