谷歌宣布将他们的最新的机器学习技术TensorFlow以开放源码项目释出。谷歌以Apache 2.0 授权模式开放以 Python 或 C++ 为主要服务语言的 TensorFlow 项目,并将这个项目的程序码与相关工具放在 Github 上。
TensorFlow 是 谷歌继 2011 年开发了 DistBelief 之后,透过使用资料流 ( 图像,来进行数值演算的新一代开源机器学习工具。这个机器学习工具的基础设计,主要透过图学里的节点来表达数学运算,边 来表示节点间的多维度资料阵列 (tensors,张量),因此命名做 TensorFlow。
TensorFlow 主要由 谷歌 机器智慧研究室与 谷歌 大脑研究组 的学者与工程师所开发,容许开发者自由配置运算环境来做深度神经网络研究,但也足以支持普通环境所需要的服务(例如透过影片进行图像辨识);你可以部署 TensorFlow 在使用一个或多个 CPU 或 GPU的桌机或服务器上,也可以透过一个 API 部署在行动装置里。
Gmail的垃圾邮件判读、谷歌相簿脸部识别、谷歌翻译,我们天天都在使用 谷歌的机器学习系统,现在谷歌将TensorFlow以开放源码项目释出了。相比IBM,微软与百度等竞争对手的封闭路线,再次打出开源牌的谷歌是否又会成为机器学习领域的霸主呢?谷歌为什么要推开源机器学习系统?
没资料,光有技术,机器学习就只是空谈
如果将机器学习比喻成一架火箭,那大量的数据就是驱动它的能源,并且需要各种创意、多方思考设立出来的模型和运算能力来支持整个学习过程,而且计算机不比人脑,人脑只需要有限的例子和经验就能够成功学习。计算机则是需要非常多样本和案例来建立认知。谷歌人工智能、运算神经科学及可量化机器学习研究员科拉多强调。
言下之意,只靠谷歌自己发展机器学习技术势必会遇到一些难题,资料量不够多元。计算机的学习过程是相当缓慢,消耗的时间非常长,深度学习需要投入大量的人力与资源进行相关研究科拉多说。在这样的情况下,谷歌透过开放机器学习让开源社群帮谷歌收集、整理各式各样大量可用来训练类神经网络的资料。
没资料,光有技术,机器学习就只是空谈。就像火箭要有燃料,要不然只有推进器,火箭也飞不起来!公子义认为,一但开放机器学习系统,用的人越多,资料越多元,越多量多变,谷歌机器学习系统更聪明,能提供的服务就越好,可以提供更多种服务,形成一个正向循环。
谷歌想要让机器学习认 a~z 26个小写字母,但每个人的字迹不同,谷歌若自己要 准备各种不同笔迹字母太旷日费时,但若全世界有20%的人,一人给 Google 一份自己写的a-z字母,有了这些大量,又多形变的资料,谷歌机器认字母的能力也就越强。因此 谷歌利用开放模式解决以上的难题。
也许你要问,谷歌不是手握大量使用者数据了吗?为什么这些数据量还不够呢?
谷歌过去收集的资料不适合用来做机器学习?
公子义【微信号gongzi348】认为谷歌过去收集的资料都不适合用来做机器学习,因为那些资料并没有被赋予足够具体的意义。
举例来说,谷歌手边有很多1、one与“一 ”等资料,但机器并不懂得什么意思。机器不知道1 ... 是 1 不是 2 、one是 1 不是 2 、一是 1 不是 2 。机器学习就跟教小孩很类似,你要他叫爸爸,你就得先告诉他谁是爸爸。
因为类神经网络是模拟人的大脑,训练类神经网络,就跟教育婴幼儿一样。资料要大量、多变化,资料的质量也重要,就是要大量且要含括足够的变化,所以需要整个社群提供资料并且赋予这些资料正确具体的意义。因此,透过开源 TensorFlow 这个工具, Google 得以号召整个开发社群透过利用该工具提供相关服务时,帮 Google 完成收集真实世界资料的任务。
那对开发者或研究员来说,Google的开源机器学习系统吸引点在哪里呢?
利用开源精神先把饼做大
谷歌 虽然发展机器学习10年,但还有许多领域未探索。因此需要这个社群共享力量,加速机器学习进展。利用机系学习系统获利并非 Google 现行目标,现在最重要的是社群的建立,透过开源社群的快速分享,建立共同标准。这对机器学习的发展非常重要。
相较竞争对手微软、IBM 与百度,机器学习技术需要付费,谷歌的免费对于开发者的吸引力巨大。
利用开源社群资料,即将壮大谷歌自身系统?
让全球聪明人,给谷歌很好的反馈与贡献,甚至连竞争对手的团队都会用它, 谷歌不走常人之路。 Alphabet 集团执行董事长施密特(Eric Schmidt)强调。
谷歌目前透过两方面应用机器学习技术强化现有的产品服务(如:谷歌搜寻里的排名建议)与提供更先进更新颖的产品服务。如语音文字与图像辨识。公子义认为谷歌 的语音搜寻就是透过机器学习让正确度不断提升。
这对 谷歌 的 Mobile Only 政策具有重大的影响,在行动的世界,不需要手,我们使用语言沟通,计算机直接辨识图像。
公子义【微信号gongzi348】80后,90后心理研究专家,4年心理学,9年大数据研究者,专注于移动互联网,大数据究狂热爱好者,热爱写作。原创文章,未经许可,严禁转载,违者追究法律责任。