谷歌即将成为机器学习的新霸主?

谷歌宣布将他们的最新的机器学习技术TensorFlow以开放源码项目释出。谷歌以Apache 2.0 授权模式开放以 Python 或 C++ 为主要服务语言的 TensorFlow 项目,并将这个项目的程序码与相关工具放在 Github 上。

谷歌即将成为机器学习的新霸主?

TensorFlow 是 谷歌继 2011 年开发了 DistBelief 之后,透过使用资料流 ( 图像,来进行数值演算的新一代开源机器学习工具。这个机器学习工具的基础设计,主要透过图学里的节点来表达数学运算,边 来表示节点间的多维度资料阵列 (tensors,张量),因此命名做 TensorFlow。

TensorFlow 主要由 谷歌 机器智慧研究室与 谷歌 大脑研究组  的学者与工程师所开发,容许开发者自由配置运算环境来做深度神经网络研究,但也足以支持普通环境所需要的服务(例如透过影片进行图像辨识);你可以部署 TensorFlow 在使用一个或多个 CPU 或 GPU的桌机或服务器上,也可以透过一个 API 部署在行动装置里。

目前 Gmail 已经可以自动判断约 99%的垃圾邮件。

Gmail的垃圾邮件判读、谷歌相簿脸部识别、谷歌翻译,我们天天都在使用 谷歌的机器学习系统,现在谷歌将TensorFlow以开放源码项目释出了。相比IBM,微软与百度等竞争对手的封闭路线,再次打出开源牌的谷歌是否又会成为机器学习领域的霸主呢?谷歌为什么要推开源机器学习系统?

没资料,光有技术,机器学习就只是空谈

如果将机器学习比喻成一架火箭,那大量的数据就是驱动它的能源,并且需要各种创意、多方思考设立出来的模型和运算能力来支持整个学习过程,而且计算机不比人脑,人脑只需要有限的例子和经验就能够成功学习。计算机则是需要非常多样本和案例来建立认知。谷歌人工智能、运算神经科学及可量化机器学习研究员科拉多强调。

Gmail 的 Smart Reply 功能,自动侦测对方寄来的邮件内容,并建立简单的回覆。

言下之意,只靠谷歌自己发展机器学习技术势必会遇到一些难题,资料量不够多元。计算机的学习过程是相当缓慢,消耗的时间非常长,深度学习需要投入大量的人力与资源进行相关研究科拉多说。在这样的情况下,谷歌透过开放机器学习让开源社群帮谷歌收集、整理各式各样大量可用来训练类神经网络的资料。

没资料,光有技术,机器学习就只是空谈。就像火箭要有燃料,要不然只有推进器,火箭也飞不起来!公子义认为,一但开放机器学习系统,用的人越多,资料越多元,越多量多变,谷歌机器学习系统更聪明,能提供的服务就越好,可以提供更多种服务,形成一个正向循环。

谷歌想要让机器学习认 a~z 26个小写字母,但每个人的字迹不同,谷歌若自己要 准备各种不同笔迹字母太旷日费时,但若全世界有20%的人,一人给 Google 一份自己写的a-z字母,有了这些大量,又多形变的资料,谷歌机器认字母的能力也就越强。因此 谷歌利用开放模式解决以上的难题。

谷歌相册已经可以让使用者透过标签搜寻找到相关的照片

也许你要问,谷歌不是手握大量使用者数据了吗?为什么这些数据量还不够呢?

谷歌过去收集的资料不适合用来做机器学习?

公子义【微信号gongzi348】认为谷歌过去收集的资料都不适合用来做机器学习,因为那些资料并没有被赋予足够具体的意义。

举例来说,谷歌手边有很多1、one与“一 ”等资料,但机器并不懂得什么意思。机器不知道1 ... 是 1 不是 2 、one是 1 不是 2 、一是 1 不是 2 。机器学习就跟教小孩很类似,你要他叫爸爸,你就得先告诉他谁是爸爸。

谷歌 语音辨识功能的错误量已经减少逾 20%。

因为类神经网络是模拟人的大脑,训练类神经网络,就跟教育婴幼儿一样。资料要大量、多变化,资料的质量也重要,就是要大量且要含括足够的变化,所以需要整个社群提供资料并且赋予这些资料正确具体的意义。因此,透过开源 TensorFlow 这个工具, Google 得以号召整个开发社群透过利用该工具提供相关服务时,帮 Google 完成收集真实世界资料的任务。

那对开发者或研究员来说,Google的开源机器学习系统吸引点在哪里呢?

利用开源精神先把饼做大

谷歌 虽然发展机器学习10年,但还有许多领域未探索。因此需要这个社群共享力量,加速机器学习进展。利用机系学习系统获利并非 Google 现行目标,现在最重要的是社群的建立,透过开源社群的快速分享,建立共同标准。这对机器学习的发展非常重要。

谷歌机器人即将成为全球霸主?

相较竞争对手微软、IBM 与百度,机器学习技术需要付费,谷歌的免费对于开发者的吸引力巨大。

利用开源社群资料,即将壮大谷歌自身系统?

让全球聪明人,给谷歌很好的反馈与贡献,甚至连竞争对手的团队都会用它, 谷歌不走常人之路。 Alphabet 集团执行董事长施密特(Eric Schmidt)强调。

谷歌目前透过两方面应用机器学习技术强化现有的产品服务(如:谷歌搜寻里的排名建议)与提供更先进更新颖的产品服务。如语音文字与图像辨识。公子义认为谷歌 的语音搜寻就是透过机器学习让正确度不断提升。

结合拍照功能即刻看到结果的 谷歌翻译

这对 谷歌 的 Mobile Only 政策具有重大的影响,在行动的世界,不需要手,我们使用语言沟通,计算机直接辨识图像。

公子义【微信号gongzi348】80后,90后心理研究专家,4年心理学,9年大数据研究者,专注于移动互联网,大数据究狂热爱好者,热爱写作。原创文章,未经许可,严禁转载,违者追究法律责任。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容