Google是如何用你的大脑来改良Android的

作者:Robert McMillan
原文:Wired
翻译:haru

image

人声的图像,来自AndroSpectro app。
摄影:Ariel Zambelich / Wired

当Google在开发它的Android移动操作系统的最新版本时,这位互联网巨人对操作系统识别你的语音控制的方式进行了一些较大的改动。它安装了一个基于所谓“神经网络”的语音识别系统。“神经网络”是一个会像人脑一样学习的计算系统。

Vincent Vanhoucke是Google的研究科学家,他参与了这项计划。他说,对许多用户来说,结果是戏剧性的。“很意外,我们只是改变了模型,出来的效果却好了很多。”

Vanhoucke说Android的名为Jelly Bean的最新版本的语音错误率比之前版本低了25%,这使得人们更愿意使用语音控制。“现在的人们在对手机说话的时候会使用更自然的语言。”也就是说,他们没有以前那么像在跟一个机器人说话了。“人们的使用方式真的改变了。”

这只是神经网络算法改变科技以及我们如何利用它的例子之一。19世纪80年代对这一领域的研究非常火热,然后陷入了冷藏,现在又回来了。微软、IBM和Google都在探究这一领域的实际应用。

当你对着Android的语音识别软件说话的时候,你的声谱会被切割然后送到八台位于全世界各地的Google的服务器基地的不同的电脑。接着声谱被由Vanhoucke和他的团队制作的神经网络模型处理。Google恰好非常擅长于解决这类大型计算任务并快速处理它。Google依靠Jeff Dean和它的工程师团队来研究解决方案。他的团队以重新发明现代数据中心的工作方式闻名于世。

神经网络让像Vanhoucke这样的学者可以分析许多许多种模型——对Jelly Bean来说,是对话的声谱——然后预测一个全新的模型的发展方式。这就跟生物学类似,身体中的神经细胞与其他细胞组成网络,让它们用特别的方式处理信号。Jelly Bean使用的那种神经网络,可能是Google设计了许多种语言发生的模型,例如通过分析多种现实世界的数据宽度来处理英语语音搜索请求。

“长久以外人们都认为你必须使用很多层特征来形成一个足够好的感知系统,大概是基于你在脑中看到的。”多伦多大学的计算机可续教授Geoffery Hinton说道,“但问题是你如何高效地掌握它们。”

Android给语音控制拍一张照片,然后Google使用神经网络模型来处理并计算出它说的是什么。

Google的软件首先试着挑选出语音中的独立部分——组成单词的不同类型的元音和辅音。这是神经网络的第一层。然后它用第一层信息来构建更复杂的猜测,这之间错综复杂的联系的每一层都促使它更清晰理解到底说的是什么。

神经网络算法也可以用用来分析图像。“你需要做的是找到像素结构的小碎片,比如图片的边缘。”Hinton说,“你或许会用一层特征探测器来探测像小边缘这样的东西。然后你会用另一层特征探测器来探测由边缘组成的小组合,比如角落。一旦你完成了,就会有另一层来了,以此类推。”

80年代的时候神经网络就试图完成以上这一切,但像Hinton所描述的那种用许多层来分析的方法其实非常困难。

到了2006年,两项重大的变化出现了。首先,Hinton和他的团队找到了一个更好的设计出更深神经网络的方法——拥有多层连结的网络。其次,廉价的图形处理单元出现了,让学者们使用很快更经济的方法来完成他们需要的上亿次计算工作。“真的是个巨大的进步因为速度快了30倍,”Hinton说。

image

Google的Jeff Dean改善了Android的语音识别系统。

摄影:Ariel Zambelich/Wired

现在,神经网络算法开始进入语音识别和图像软件领域,但Hinton认为它会被拥有任何需要做预测的地方。11月时,多伦多大学的一个团队使用神经网络预测了毒品分子在现实生活中会如何作用。

Jeff Dean称Google现正将神经网络算法用于许多不同的产品——某些是试验性的,但另一些并不是——但没有一个目前能做到像Jelly Bean的语音识别软件那么先进。“图像搜索里肯定也用到了,”他说。“你会想要使用图上的那些像素来识别图上的物体是什么东西。”Google街景搜索可以使用神经网络来识别他们拍摄的事物间的区别——比如一座房子和一个牌照。

不要以为这些不会影响普通人。去年,包括Dean在内的Google研究员们设计了一个神经网络程序,它自己教会了自己如何在YouTube上识别猫。

微软和IBM也在研究神经网络。10月,微软的首席研究官Rick Rashid在中国北京展示了基于微软的神经网络的语音处理软件。在演示中,Rashid用英语说话并在每一个词组后暂暂停。令观众惊讶的是,微软的软件同步翻译了他说的话并用中文告诉了观众。这款软件甚至调整了它的语调来显得更像Rashid的声音。

“在这个领域还有很多功课要做,”他说。“但这项技术非常有前景。我们希望在未来几年我们可以打破人们之间的语言壁垒。个人来讲,我认为这将会带来一个更好的世界。”

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,135评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,317评论 3 397
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,596评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,481评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,492评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,153评论 1 309
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,737评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,657评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,193评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,276评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,420评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,093评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,783评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,262评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,787评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,427评论 2 359

推荐阅读更多精彩内容