现在的人工智能

今天的AI,我们看到太多的炫技、PPT和Demo。太多为演示而存在的产品。太多为概念而存在的公司。太多只做技术,而不知怎么把产品落地的、形形色色的创业者。在人类历史上,任何行业的崛起,历来都是——技术先导,产品跟上,商业闭环,从而形成推动人类社会一波又一波向前发展的浪潮。

目前的 AI 技术并不是那么靠谱,还是不成熟的。做人工智能的产品,不要直奔主题而去。做金融,就不要直接去做投资研究系统。做医疗,不要直接做诊断系统。做招聘,不要直接做人才匹配系统。直奔主题的失败不是特例,很多大公司都是上来就做一个特别大的系统, 90% 都会失败。

因为,真正的人工智能产品,一定是技术、内容、产品、设计的跨界复合体,单靠某一块很难做出真正感动人心的产品。我们认为人工智能的商业化,仅仅依靠技术是很难继续走下去的。数据的规模和采集能力决定了人工智能在这个行业的发展速度。

但在这个喧嚣浮躁的社会里,看到越来越多围绕智能机器人,打上AI旗号的企业无非就是编写故事、拉投资、卖股份;也很少有人费尽心思去核查AI领域流行那些说法,媒体从AI成功故事中攫取利益,AI领域也会因鼓吹巨大进步从政府和支持者那里得到更多研究资金,大不了回归学术领域教书去。

AI领域一点创新都会成为媒体头条,能够静下心来客观理智分析探讨AI与机器人的过去、现在及未来的人很少,更别提回归智能的本质与商业本质了。真正愿意购买部署AI的企业主很少,AI与深度学习不是万能药。因为在如今的浮躁社会中却少人问津,很多创业者、企业家、投资人都沉醉于工具及其概念的炫酷,比如云计算、大数据、AI、AR、SAAS等,却忽略了工具不该是方向、用好工具为客户创造价值才该是方向 。

B端企业主真实需求是赚钱工具,后才是降低成本,最后才是提高效率;很多智能客服不盈利原因在于中小企业主需要的是大量订单而不是降低几个人力成本的问题,小企业为业务(生存),中型企业为发展(订单)大型企业才需要提高(效率)规范流程制度,多聆听企业主老板们的需求,不了解行业就不熟悉业务流程那就出不了方案,切记刚需/高频/痛点,宁可机器笨一点出一点差错但是确实是刚需企业主就愿意付钱;

人工智能=“人工+智能”:人工协调机器发展,机器辅助人类工作,智能在于高层思维智能、中层感知智能、基层行为智能。只有投入更多的研发人员和数据,才会获得更多的智能。仅靠一两名人工专家很难解决复杂的人工智能问题。中国企业的人工智能转型,需要依靠的是在研发费用和研发人员规模上的持续投入。

AI必须要以应用为驱动为主,重视产业链整合和产业生态培育。未来人工智能不仅是企业之间的竞争,更是产业生态之间的竞争。人工智能产业发展,需要不断用真实数据进行学习训练,形成迭代反馈,使人工智能持续进步,这就需要产业集群发展的良好生态。当前,我国人工智能发展总体还是企业间的竞争,尚未形成产业联盟,产业链营造还处在初始阶段,政府支持没有形成体系。

最终判断人工智能实力是大数据、云计算、算法、场景、训练时间及其总投入以及软硬件综合实力等;智能决策支持系统(IDSS)未来发展趋势以下5个方面:注重基于知识的人机交互、分布式并行化决策求解、注重各种相关技术的集成应用、决策过程的理解以及时空与多维决策过程;程序=结构+算法 产品=品质+痛点 痛点既灵魂;

目前人工智能的两个维度,以及围绕这两个维度展开的竞争,即软件开发框架和计算芯片:

► 软件开发框架:主要的框架包括谷歌的TensorFlow,Facebook,IBM,谷歌DeepMind 支持的 Torch,Microsoft 的CNTK,Amazon 的 MXNet。NVidia 也提供自己的软件开 发框架 CUDA。这些公司之间的竞争类似于智能手机操作系统上iOS/Andorid 之间的 竞争。

► 计算芯片:目前的竞争对手包括NVidia/AMD 的 CPU,谷歌的 TPU,Xilinux 的FPGA 之间在计算成本和速度上的竞争。这些公司之间的竞争类似与高通和联发科在手机 芯片上的竞争。在 TPU 的例子上我们看到,谷歌利用其在软件开发框架上的优势, 减小切换计算芯片(GPU to TPU)时的软件修改成本,形成一个 Tensor Flow+TPU 的封闭生态环境。

深度学习将向两大方向发展:一是越来越强的计算力,一是整合异构计算。谷歌 TPU 和 TensorFlow 的优势只是暂时的,英特尔正在开发比 TPU 第二代更好的芯片,因为深度学习模型在某种程度上可能朝着暴力计算发展。未来的深度学习模型可能更小、模型利用率更高,这样就不需要几十亿的 TPFLOTS——实际上,深度学习,要成功,要超越竞争者,不仅仅看 TPFLOTS。

CPU、GPU 和以 TPU为代表的专用芯片构成了现在深度学习上的三大芯片力量,而它们背后的三大公司——英特尔、英伟达和谷歌都在构建基于自己特长的生态,三家公司不仅在芯片,而且在云端和软件框架上也存在直接竞争,整个市场一片火热。

目前专注于深度学习领域的企业已经意识到没有常识寸步难行,所以2010年微软开启的Satori项目,2012年谷歌对外公开知识图谱计划,当时知识图谱已经包含5.7亿个事物以及他们之间的180亿个联系,说明知识表达及知识工程被如今的AI重新受重视;深度学习系统需要一个非常大的数据集来训练他们;

DeepMind 和 OpenAI 是现在人工智能研究界最重要的两大研究机构,当其联手时,我们能看到什么样的成果诞生呢?目前能够真正使用AI,并享受到AI红利的公司少之又少,更多尚未‘AI化’的公司在思考两大问题:如何拥有AI的能力;以及在纷繁复杂的信息里面,该如何选择最适合企业自身的算法及技术。AI一定会在那些容易获得大量数据、试错成本不高的领域率先爆发。

比如AlphaGo赢人类不好奇,你去问那些群众为什么机器可以赢得人类,它们就回答不出来了。除了会下围棋但还会干什么呢?还有花了16000台世界上最快计算机,耗费数月来识别一只猫,一只老鼠识别一只猫需要多长时间呢?也就是说机器的功耗及训练时间都需要提高。AlphaGO  1920块处理器及280块GPU,每小时消耗440千瓦能量(不包括训练过程消耗能量)

下围棋本身就是一种典型的问题空间的表达和搜索问题,刚好计算机擅长这些,AI算法把树形搜索、问题空间拓展得非常充分,高性能的计算使得检索的效率提高。DeepMind采用了修改了蒙特卡罗算法(树形检索),AlphaGo通过跟自己对弈增强自身学习效果(强化学习),AlphaGO的神经网络通过围棋大师15万场比赛棋谱得到训练。

但是很少有人注意到2015年9月,马修.莱推出了一个名为Giraffe的开源围棋引擎,能够通过深度强化学习在72小时内自学掌握下棋,2016年1月份马修莱加入谷歌DeppMind,2个月后AlphaGO打败了围棋大师。所谓的暴力计算是AI发展领域过去不敢想象的。

那2015年,微软百度都各自宣布图像识别效果超过了人类的表现,对同一个物体识别中,机器的错误率确实低于人类平均错误率,人类识别率平均保持5.1%水平,微软当年年底推出的CaptionBot技术走红原因不是在场景识别而是优于人类犯的错误。百度的深层视觉系统运行定制超级计算机Minwa(包括432块CPU及114块GPUs)面向公众的APP还没有出现,百度还有在ImageNet大赛因为作弊被取消资格。图像识别一直是谷歌专长,但是2010年推出的Goggles项目最后以失败告终,所以有时企业的宣传语就像笑话。

但是机器战胜人类棋手并不是说机器智能战胜了人类,人的智能很多方面的,包括运动智能、感知智能、推理智能、计算智能、决策智能和控制智能,是由一系列环节紧密协作、交互融合构成的。

人工智能应该与商业相结合,而不能为了“人工智能”的标签而去做人工智能。最首要的是技术跟趋势结合之后能给用户带来实在的好处。脱离了使用场景的人工智能没有意义。to C的公司要和实际的生活场景结合, 给消费者带来更好的使用价值和体验;to B的公司要和垂直行业的商业逻辑相结合, 给商业用户带来实实在在的价值。

孤立的 AI 技术是没有用的。它需要大量的定制,来明确它如何能够适应你的业务概念。这需要对你的公司有全面的了解,需要对 AI 有深入的理解。开发 AI 的价值需要一个了解业务背景的团队,并需要他们具有将 AI 融入医院或物流网络中的跨领域知识。如果缺乏关于业务运营的跨领域知识,就很难定制AI 来驱动具体的业务结果。初创公司在建设跨领域团队方面一直很有成效。

AI说到底是一种智能软件,智能软件的主要风险不在于“智能”,而在于“软件”。像所有的软件一样,它会包含错误。如果将其用于包括自驾车在内的高风险应用,则这些错误有可能危及人的生命和财产。AI技术需要通过关注测试、检验、确认、鲁棒性和强大的人机界面而变得更加成熟。在与安全相关的应用程序中部署AI的时候,我们应该非常小心。

对于大多数AI系统,特别是基于机器学习的AI系统,我们无法验证其正确性。对于监督学习,只有在测试数据与训练数据来自相同的分布的假设下,我们才能验证其正确与否。最近的一些工作表明,深层神经网络容易受到对抗数据的影响。因此,在真实条件下,我们需要一个可测试的方法来保证系统的准确性。在绝大多数应用程序的设置中,AI系统不能完全自动运行。

机器学习是人工智能领域的重要分支,而深度学习又是机器学习的一个分支,至今已有数种深度学习框架,在计算机视觉、语音识别、自然语言处理、生物信息学等领域取得良好的效果。

论机器学习应用场景可以先套用杨强教授(第四范式联合创始人、首席科学家)的人工智能成功的五个必要条件:清晰的商业模式、高质量的大数据(持续反馈)、清晰的问题定义和领域边界、懂人工智能的跨界人才(擅长应用和算法)、计算能力。

因为对于我们技术出身的技术人员很可能对商业应用这些方面思考不足。因此无论技术占比有多少,多想成为独角兽,商业应用场景永远都是出发点。我们不要只强调深度学习,而是‘技术+’垂直场景是关键”。

对于初学者来说,面对大量的机器学习算法,望而却步,经常疑惑“我应该使用什么算法?”然而要回答这个问题并不容易,需要取决于许多因素。

这些因素包括:数据的规模、质量和属性;

•   计算的时间控制

•   任务的紧急程度

•   想要对数据进行什么处理

即使是非常有经验的数据科学家也不能够在尝试多种不同算法前回答到底哪种算法是最有效率的;

当人工智能的来临,商业或重新洗牌、尸鸿遍野,创业公司最难的是在产业中把握方向。传统巨头待改革,互联网公司有数据优势,而赛道和应用场景是每一个项目都会被问到的问题。大家知道监控市场很大,真正人脸识别技术在里面发挥的作用有限,其中还存在很多问题。虽然那里面的钱很多,但是大家现在都没赚到。不过,当前人脸识别也有一定的局限性。

一、不容易区分相似面部;

二、在光照条件不佳、逆光条件下,识别阴阳脸的成功率有待提高;

三、不能很好应对人的多变表情;

四、面部遮挡影响识别;

也就是因为现在的大机构在选择AI技术和服务相关供应商的时候,处于竞争,成本方面的顾虑,并不愿意都选择大型科技公司,而更愿意与初创公司合作(当然也有熟人关系等因素)。

根据计算机世界预测未来会是语义网的:语义网是对未来网络的一个设想,现在与 Web 3.0 这一概念结合在一起,作为 3.0 网络时代的特征之一。简单地说,语义网是一种智能网络,它不但能够理解词语和概念,而且还能够理解它们之间的逻辑关系,可以使交流变得更有效率和价值。

语义网核心是:通过给万维网上的文档 (如:HTML文档、XML文档)添加能够被计算机所理解的语义「元数据」(外语:Meta data),从而使整个互联网成为一个通用的信息交换媒介。

其实好的产品是总结出来的,并不是设计出来的。我们从具体的小事情开始做起来,当我们完成了 10 个解决方案的时候,我们或可以从当中总结出一个系统出来。当我们连解决方案都找不到时,我们就需要从零件、工具开始做起来的。一个产品首先需要很多零件去制造工具,没有工具就没有解决方案,没有解决方案就没有系统。

每一个工具、每一个理念,都有它当时的作用,在构造一个系统的时候,我们把这些中间节点找到他们的应用场景,然后去培育这个技术。这是所有复杂系统的统一的规律。产生伟大的AI公司需要可演化的产品。直奔市场、用户、需求所要求的主流刚需而去,就是让 AI 产品失败的保证书。

因为做AI产品我们会有四种选择——零件、工具、解决方案、系统。我们在实际解决问题的时候,我们很难交付一个复杂的系统。优秀的 AI 创业者不约而同地选择一种路径,为了设计实现一个通用系统,不得不先做包工头,做了一个一个的解决方案,从解决方案里面总结一个系统出来。

好比现在很多人工智能产品的公司在发展过程中会有场景跃迁:比如出门问问,开始做出行 App ,后来做了手表、车载导航;云知声的发展,最早的业务是搜音乐,后来做了语音云,为很多行业的产品方案,下一步的场景包括智能家居。所以说人工智能必须结合一个垂直的领域,解决具体的问题,这是人工智能最有机会的地方。

还有种说法:“不断进化”人工智能系统,这里面包含几层含义,一是开发能更好解决问题的软件;二是通过学习人类行为自我提高的软件;三是通过自学自我改进的软件;

奇点理论的一个前提是机器将不仅仅变得非常智能,而且甚至可以独自制造其他更加智能的机器,但是目前可以编写其他软件程序的软件并不存在。人工成本越高,研发更加聪明机器就越强烈。从长远来看,机器人或许通过一些项目有所长进,比如OpenEase,机器分享知识平台;或RoboHow,帮助机器人学习新的任务;或RoboBrain,通过人的示范和建立新的学习任务;

切记:聪明的不是机器而是设计机器的工程师。高级推理需要的计算量不大,反倒低级的机器感知运动技能需要庞大计算资源;创造AI不是目标,因为AI本身不是产品而是一套技术工具,提高利润降低成本才是目标。结构化环境中引发机器人和自动化服务井喷式爆发,280亿美元市场份额机器人中,大部分是工业机器人,用于生产线的机器人,完全跟智能不沾边:购买扫地机器人都是年轻人夫妻但是也是图个新鲜,购买回来用三个月多就不用了,洗衣机用得比它多(刚需)

机器翻译采用的最成功算法是统计分析,翻译几乎不需要任何语言知识;这些程序只是收集成千上万人类专业译者的翻译结果,并计算那种译法最常见;开发和优化自动翻译系统的程序员不需要掌握语言和目标语言;也就是说有时模仿人类思考模式就去构建AI系统未必是一件好事,因为机器思维和人类思维模式不同;人工智能与人类智能不是一回事,人类有目的与一是,而机器没有;

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容