AI领域为何缺乏突破?前Quora工程VP:Hinton没有说到点子上

姓名:范凌峰    学号:16020188020

转载自:https://zhuanlan.zhihu.com/p/53139915

【嵌牛导读】:2018 年还剩 7 天!前 Netflix 研究/工程负责人、Quora 工程 VP,现人工智能创业公司 Curai 联合创始人&CTO Xavier Amatriain 回顾了这一年的机器学习/人工智能进展。让我们来看看他的观点。

【嵌牛鼻子】:AI

【嵌牛提问】:AI领域为何缺乏突破?

【嵌牛正文】:

如果非要用几行字总结 2018 年机器学习领域的亮点,那么我会用以下四条来总结:

AI 炒作和散播 AI 恐惧降温

更加关注具体问题,如公平性、可解释性或因果关系

深度学习对图像分类以外的实践也很有用(尤其是 NLP)

AI 框架之争逐渐白热化。如果你想在该领域功成名就,最好先发布自己的框架。

接下来我们来看一下具体内容。

AI 炒作和散播 AI 恐惧降温

2017 年可能是散播 AI 恐惧和 AI 炒作的一年,而 2018 年这些「宣传」开始降温。尽管一些大人物继续发表关于 AI 恐惧的言论,但他们或许太忙了,没把这件事当作日程重点。同时,媒体等群体在对待这个问题时似乎变得较为平静,尽管自动驾驶汽车和类似的技术不断发展,但不会立刻成真。也就是说,仍然有声音在抵抗「约束 AI 而不是约束 AI 产出」的糟糕主意。

更加关注具体问题

过去这一年,人们的关注点似乎转移到可以解决的更具体问题。例如,关于公平性的讨论增多,不止很多学术会议在谈论这个话题,一些在线课程(如谷歌开发的课程)也在讨论公平性。

这一年,可解释性、解释(explanation)、因果关系等问题也得到了广泛讨论。因果关系似乎重新引起了大家的注意,这主要是因为 Judea Pearl 著作《The Book of Why》的问世。Judea Pearl 不仅决定写下自己的第一本「通俗」读物,他还在 Twitter 上鼓励大家讨论因果关系。实际上,即使最通俗的媒体也把因果关系描述为现有 AI 技术的「挑战」,甚至 ACM Recommender Systems Conference 的最佳论文就在讲如何在嵌入中纳入因果关系(《Causal Embeddings for Recommendations》)。也就是说,很多作者认为因果关系某种程度上是一种理论偏移,我们应该重新关注更具体的问题,如可解释性或解释。说到解释,这方面的一大亮点是 Anchor 论文和代码的发布(Anchors: High-Precision Model-Agnostic Explanations),这是著名的 LIME 模型作者的后续之作。

深度学习对图像分类以外的实践也很有用

尽管深度学习作为最通用的 AI 范式仍然存在很多问题,尽管 Yann LeCun 和 Gary Marcus 就此辩论了 n 次,但是我们可以确定的是深度学习不止于此,从可以提供的能量来看,它离到达平台期还很远。具体来说,这一年深度学习方法在视觉以外的其他领域取得了空前成功,包括语言、医疗等。

今年最有趣的进展实际上出现在 NLP 领域。如果非要我选择今年印象最深刻的 AI 应用,那么我选择的两个都是关于 NLP 的(而且都来自谷歌)。第一个是 Smart Compose,第二个是 Duplex 对话系统。

NLP 的大量进展受到使用语言模型这一思路的启发,ULMFiT 使大家了解到语言模型的力量(参见:NLP 领域的 ImageNet 时代到来:词嵌入「已死」,语言模型当立)。我们看到很多其他(以及改进版)方法,如 Allen 的 ELMO、Open AI 的 transformer和谷歌近期提出的BERT。这些模型被描述为「NLP 的 Imagenet 时刻」,因为它们提供了即用的预训练通用模型,可在用于特定任务时再进行微调。除了语言模型以外,还有很多有趣进展,如 Facebook 的多语言嵌入系统。我们看到这些方法很快被整合到更通用的 NLP 框架,如 AllenNLP 或 Zalando 的 FLAIR 框架。

AI 框架之争

在框架方面,2018 年,「AI 框架之战」白热化。令人惊讶的是,Pytorch 似乎追赶上 TensorFlow。尽管将 Pytorch 用于生产环境仍然是次优的,但 Pytorch 在这方面的追赶速度超过 TensorFlow在易用性、文档和教育方面的追赶速度。有趣的是,选择 Pytorch 框架来实现 Fast.ai 库可能发挥了很大助力。不过,谷歌意识到这些,并走在正确的方向上,如将 Keras 集成到 TensorFlow 中、聘用具备开发者背景的管理者 Paige Bailey。不管怎样,我们都从这些很棒的框架中获益良多。

在框架空间中取得很多有趣进展的另一个领域是强化学习。虽然我觉得 RL 研究进展不像前几年那样令人印象深刻(只能想起来 DeepMind 的近期研究IMPALA),但在仅仅一年的时间里看到所有主流 AI 玩家发布 RL 框架还是非常惊喜的。谷歌发布了Dopamine研究框架,Deepmind 发布了颇有竞争力的 TRFL 框架。Facebook 不甘落后,发布了Horizon,微软也发布了专门用于训练基于文本的智能体的 TextWorld。希望这些开源福利可以帮助我们在 2019 年取得更多 RL 进展。

谷歌最近发布了基于 TensorFlow 的 TFRank。排序是 ML 应用中极其重要的一个应用方向,应该得到更多应有的重视。

基础性突破

深度学习似乎已经消除了对数据的精细要求,但事实并非如此。在提高数据质量方面的研究仍然有非常有趣的进展。例如,尽管数据增强之前就被提出,对很多 DL 应用都很重要,但今年谷歌发布了一种可自动增强训练数据的深度强化学习方法——auto-augment。一种更加极端的想法是用合成数据训练 DL 模型。这方面的实践已经有了一些,许多人将其看做 AI 未来的关键所在。英伟达在其论文《Training Deep Networks with Synthetic Data: Bridging the Reality Gap by Domain Randomization》中展示了有趣的新想法。在《Learning from the experts: From expert systems to machine-learned diagnosis models》中,我们还展示了如何使用专家系统生成可用于训练 DL 系统的合成数据,这些数据甚至可在与现实世界数据相结合后用于 DL 系统训练。最后,利用「弱监督」减少大量手工标注数据需求的方法也很值得一提。Snorkel 就是一项有趣的项目,旨在通过提供一个通用框架改进弱监督方法。

要说 AI 领域还有什么基础性突破,我看到的并不多。我并不完全赞同 Hinton 的观点,他认为 AI 领域缺乏创新是因为这一领域的研究者「年轻人多,资深者少」,尽管必须承认,年纪较大的人比较容易取得研究突破。在我看来,缺乏突破的主要原因在于,现有方法及其变体还有很多有趣而实用的应用,因此研究者不愿去冒险尝试现在看来并不实用的方法。这一领域的大部分研究都是由大公司资助的,因此这点更加明显。一篇有趣的论文《An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling》确实挑战了一些假设。尽管这份研究是高度经验性的,使用的也是已知的方法,但它打开了发现新方法的大门,证明公认的最佳方法实际上并不是最佳的。另一篇具有探索意义的论文是NeurIPS 最佳论文《Neural Ordinary Differential Equations》,它挑战了 DL 中的一些基本内容,包括层本身的概念。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,695评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,569评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,130评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,648评论 1 297
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,655评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,268评论 1 309
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,835评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,740评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,286评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,375评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,505评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,873评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,357评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,466评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,921评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,515评论 2 359

推荐阅读更多精彩内容

  • 之前的一次腿伤是在高中的时候,球场是水泥的,打起球来很伤腿,终于在几次激烈的交锋中,我的腿受伤了,自此修养了很...
    控卫阅读 156评论 0 0
  • 一 我的好友周若初是个疯子。 凌晨十二点连环夺命call,正梦到天上掉钱的我从床上起来,眼屎朦胧,穿着秋裤,顶着一...
    四月樱阅读 529评论 0 3
  • 《刻意练习》有目的的练习走出你的舒适区,但要以专注的方式制订明确的目标为达到那些目标制订一个计划,并且想出监测你的...
    Super嘉祺暖阳阅读 154评论 0 0
  • 一山一城泗水合 一楼一台阁中镜 一草一木伴地生 一...
    柠檬橙子C阅读 190评论 0 0
  • 我是个全职妈妈,生完大宝,生二宝,这些年一直都在带孩子,做饭,做家务中度过。 带孩子,有时候很烦,特别是当家里经济...
    A香菇阅读 618评论 7 18