本文由 「AI前线」原创,原文链接:AI非万能良药,但未来已来!免费下载《AI 前线》12月刊
作者|Gary,Natalie
编辑|Emily
AI 前线导读:”从 1956 年在 Dartmouth 召开的学术会议开始,人工智能发展到今天已经走过了整整一个甲子,我想这中间已有数不清的浮沉和起落,也有很多说不清道不完的故事。而此时此刻,人工智能这位『花甲老人』却再一次以全新的面貌回归到大众视野,站在了浪潮之巅。
单从技术的角度看,今年也有很多“传统技术”和人工智能结合的实践。AIOps 是今年的一个流行词,Gartner 的报告宣称,到 2020 年,将会有近 50% 的企业在他们的业务和 IT 运维方面采用 AIOps,可见其应用范围之广。人工智能和运维的结合,在阿里巴巴、Facebook 这些公司都已经得到了验证。用一句毫不客气的话来说,在这个数字的年代,任何使用传统技术来管理机器数据的组织要么忽略了信息的价值,要么已经让他们的运维团队不堪重负。在运维中落地人工智能,也是迟早的事。
另外,从云计算行业来看,国内外大型的云计算服务商都在努力叠加人工智能的能力。在刚刚结束的 re:Invent 大会上,AWS 就发布了几个 AI 相关的大杀器,相信接下来一年内各大追逐者基本也会沿着这个方向布局自己的 AI 产品。那人工智能和云计算之间是什么关系呢?马化腾说云是数字化升级的基础设施,而人工智能则是云上生长出来的前沿产品,“云 + 人工智能”未来或相当于“电 + 计算机”。沿着这个比喻往深想,你会发现确实很贴切,因为不就是有了计算机,才有了互联网时代吗?
人工智能不是万能良药,但我相信它是未来,而且现在“未来已来”。”
—— 郭蕾
《AI 前线》月刊是 InfoQ 策划的新月刊,旨在为技术人提供当今人工智能领军人物对技术和行业的评价、与大师共同探讨 AI 技术与应用、学习企业技术升级落地案例。12 月刊新鲜出炉,关注公众号后后台回复“AI”可免费下载!
生态评论
唐杉:2017,AI 芯片元年
2017 年,AI 芯片是半导体产业的亮点,而它受到的关注又远远超出半导体的圈子。这一年,从科技巨头到初创公司,新老角色轮番登场,为我们上演了精彩好戏。若干年后,当我们再回头来看,一定可以把 2017 年作为 AI 芯片元年。
四月初,Google 公布了一篇即将在 ISCA2017 上发表的论文:“In-DatacenterPerformance Analysis of a Tensor Processing Unit”。可以说正是这件“小事”,揭开了一部年度大戏的序幕,而它产生的深远影响甚至可能会持续到很多年之后。
本文从 Google 和 Nvidia 两大巨头之间的“错位战争”展开,对 2017 年 AI 芯片的重大进展进行了梳理和总结,并展望了接下来一年 AI 芯片的若干看点。
2017 的 AI 芯片大戏中,主角不仅是巨头,初创公司也都粉墨登场,戏份一点儿都不逊色。更重要的,在初创公司的“表演”中,中国公司不仅毫不怯场,而且非常出彩。接下来,AI 芯片技术还会有哪些创新?巨头们还会有什么下一步动作?初创公司的命运会如何?让我们拭目以待。
落地实践
Netflix 推荐算法,让每个人看到不一样的电影海报
不久前,Netflix 推出交错测试个性化推荐算法,计算速度提高 100 倍秒杀 A/B 测试的消息引起了不小的轰动。而仅一周后,这家视频网站宣布了他们利用情境 bandits 推荐算法,实现了视频配图的个性化处理。
多年来,Netflix 个性化推荐系统的主要目标,是为用户在合适的时间推荐合适的视频。Netflix 网站上每个分类页面下有成千上万部影片,用户账号达数十亿,为每个用户推荐最合适的视频是头等要事。但推荐系统能做到的不仅是这些。怎样让用户对你推荐的视频感兴趣?怎样让一个陌生的视频激起用户的兴趣?什么样的视频值得关注?
用来描述视频的配图或图像,是可以轻松地解决这个问题的方法之一。如果一张配图对用户有足够的吸引力,比如用户熟悉的演员、让人肾上腺激素飙升的汽车追逐场面,或者一部电影或电视节目精髓的戏剧性场景等信息(一张图片胜过千言万语),就会诱惑用户点开视频。
基于深度学习的 DGA 恶意域名分类算法
本文整理自大数据安全公司瀚思科技曾凤在上海 ICAMIT201 上的演讲速记。
实时检测 DGA 产生的恶意域名,经典的检测技术主要分为两个阶段,特征工程和分类算法。
在整个检测过程中,特征工作最为繁琐,且工作流有如下缺点:
过度依赖人工特征工程,较难实现;
偏低的检测率以及偏高误报率;
速度慢,不能实时检测。
瀚思科技基于词嵌入以及迁移学习,利用深度学习的方法实现了对 DGA 恶意域名的实时检测。
阿里巴巴年度技术总结:人工智能在搜索的应用和实践
以深度学习为代表的人工智能在图像、语音和 NLP 领域带来了突破性的进展,在信息检索和个性化领域近几年也有不少公开文献,比如 wide&deep 实现了深度模型和浅层模型的结合,dssm 用于计算语义相关性,deepfm 增加了特征组合的能力,deep CF 用深度学习实现协同过滤,rnn recommender 采用行为序列预估实现个性化推荐等。
工业级的信息检索或个性化系统是一个复杂的系统工程,深度学习的工业级应用需要具备三个条件:强大的系统计算能力,优秀的模型设计能力和合适的应用场景。我们梳理了过去一年多搜索在深度学习方向上的探索,概要地介绍了我们在深度学习系统、深度学习算法和搜索应用落地的进展和思考,希望对大家有所启发。
推荐阅读
过去几年以来,深度学习(简称 DL)架构及算法已经在图像识别与自然语言处理(NLP)、数据科学、机器学习和预测分析领域领域取得了令人印象深刻的进展。
尽管其在自然语言处理(简称 NLP)领域的应用最初较为平淡,但如今的成效已经证明这一层面将成为深度学习的另一大施展空间,并确实有能力为部分常见 NLP 任务提供最先进的支持成果。命名实体识别(简称 NER)、词类(简称 POS)标记乃至情感分析都已经成为神经网络模型超越传统处理方法的重要应用方向。而在此之中,机器翻译的进步幅度尤为可观。
本文将回顾 2017 年年内基于深度学习技术所实现的 AI 发展成效,同时结合全球 AI 大咖观点,带你回顾过去一年以来,深度学习带来的发展及其意义。
《ImageNet 冠军带你入门计算机视觉: 卷积神经网络》
在第一篇文章《ImageNet 冠军带你入门计算机视觉:监督学习与神经网络的简单实现》中,我们介绍了神经网络的基本概念以及 Tensorflow 的基本用法。本文为系列的第二篇文章,将会重点介绍卷积神经网络,包括经典的卷积神经网络,全卷积网络的基本概念和基本单元,以及卷积神经网络与神经网络的异同。最后通过实现一个在实际中有广泛应用的人脸关键点检测算法,介绍如何用 TensorFlow 构建卷积神经网络。
更多干货内容,可关注AI前线,ID:ai-front,后台回复「AI」、「TF」、「大数据」可获得《AI前线》系列PDF迷你书和技能图谱。