人之“形”
近日,谷歌人形机器人Atlas学会在复杂地形上行走的新消息在科技圈内掀起了一场不小的讨论。
据外媒报道,来自谷歌Boston Dynamics的Atlas人形机器人算法得到了升级,可以在乱石地面上更好地实现自我平衡。这一新成绩来自于人类和机器认知研究所。
在其提供的视频中,我们可以看到,当Atlas的脚踩到这些不稳定障碍物时,身体会摇晃,然后它会伸出双手保持平衡,就像人类一样。研究所表示:“Atlas人形机器人走在很小的立足点上,例如踏脚石,或是一条凸起的直线。在走出每一步后,机器人都会寻找新的立足点,平衡自身的重量。为了保持平衡,我们每走出一步都会使用角动量信息。”
事实上,从走平路到走砖瓦,双足机器人迈出的这一步非常不容易。
我们人类具备有自己的大脑,拥有自主的运动能力。当人类直立或行走的时候,大脑在不断发送指令给身体的各部分肌肉,让人类可以随时保持平衡。尽管如此,人类尚且还会在走不平坦的道路时发生摔跤。
对一个机器人来讲,要维持身体的平衡是非常难的,需要极其复杂的计算。目前在商用上,依然以履带、轮式,或者四足机器人为主。
在去年的2015“机器人奥运会”上,Atlas 还没有如今这样有效的算法。它与在挑战各种难题时也曾摔了个四脚朝天,自己还爬不起来。直到今年的早些时候,Boston Dynamics才宣布,Atlas在跌到后能自主爬起来。
人形机器人最初出现在19世纪的西欧,一直到20世纪中期仍然火热。但那时的机器人多为铁皮机器人,由发条装置提供动力,并伴随着许多骗局(比如把真人藏在机器人底部箱子里假装机器人能下象棋),也没有真正实现自动化。
1967年,日本早稻田大学的团队研发出一种人工肌肉Rubber。
1968年,早稻田大学研发的步行机器WL-3,采用机械式下肢移动模式,首次实现了类似人类的移动方式。其肢体可以站立,可也以坐下。
1969年,气动机器人WAP-1拥有了橡胶制成的人工肌肉,可以充当制动器使用。
1970年,在小型计算机的控制下,WL-5机器人能够步行及变向。
1973年,世界上首个全尺寸人形机器人亮相,它整合了肢体控制系统、视觉系统以及通讯平台,能够测量自身与物体之间距离、判断方向、握住物体等。
1987年,查理德·格林希尔创建Shadow公司,致力于打造可用于执行日常家务的通用型机器人。
1989年,太平洋西北国家实验室为美军打造机器人Manny,与真人大小相当,但并不智能。
1996年,本田公司打造的电池驱动机器人P2在东京亮相,高6英尺,重460磅。
1998年,东京大学Jouhou系统Kougak实验室研制出了全尺寸机器人H5。
2005年,REEM-A机器人研发完成,兼具行走、控制、语音和视觉开发功能。同年,RoboThespian机器人在英格兰首次亮相,拥有全面互交功能,且能够使用多种语言与人类进行沟通互动。
2007年,加州山景城的Anybots开发出了两款人形机器人,Dexter和Monty。Dexter拥有双脚,具备跳跃能力,能像人类那样不断保持自己身体平衡。
2008年,人形机器人Aero-Blue展示了折叠T恤。
2013年,日本的人形机器人Asimo在运动方面有了长足的进步,动作没有明显的停顿,移动敏捷,能灵巧做好踢足球、倒茶倒水等动作。
如今,双足机器人能自主掌握平衡,能在摔倒后自己站起来,能和人一起散步,能像人那样打扫卫生,能用它的双手举起重物,甚至能“金鸡独立”, 总算初步拥有了人之形。随着其技能的不断增强,将会大大扩展双足机器人的使用场景,也让人看到了其未来。
机器人之“魂”
在人工智能大爆炸的2016年,微软团队推出第四代小冰,并宣称她已“年满18岁”,到了“发挥社会价值”的时候了。
微软小冰成年,是来自技术方面的鉴定。成年礼上,小冰展示出了三个特点:
一是拥有独立三观。能够与人自由对话,甚至可以成为话题的发起者;
二是全息感知。即使没有一个硬件载体,更谈不上“眼睛”、“鼻子”,“嘴”,但小冰已经能够和人打电话了,在9月17日推出前,小冰据称已经悄悄给12104个人类打过了电话;
三是“能听会说”。小冰对外展示了“唱歌”方面的能力,除了演唱了湖南卫视的《夏日甜心》主题曲外,还在日本东京电玩展上,推出了第一支日语单曲。
大部分人的概念里,微软小冰是一个聊天机器人,但微软一直坚持不让小冰做一个“有用”的机器人,因为只有这样,人们才不会把它当做一个订咖啡、外卖、闹钟的工具,才会认真地跟它聊天,才会产生真正的数据,才能更好地训练以情感计算框架为基础的小冰的情感认知模型。
曾经震惊世界的阿尔法狗(AlphaGo),也是一款人工智能程序。其主要工作原理是“深度学习”:多层的人工神经网络。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。这就像生物神经大脑的工作机理一样,通过合适的矩阵数量,多层组织链接一起,形成神经网络“大脑”进行精准复杂的处理。
再比如说今年奥运会期间会写新闻报道的机器人 Xiaomingbot 。整个奥运会期间,Xiaomingbot 写了四百多篇新闻稿,每条稿件的写作时间平均不到两秒钟。写作的稿子大概有一百多万的阅读量,有的稿子的阅读量甚至高过于记者人工写作的稿件。Xiaomingbot 是头条实验室和北大计算机所合作完成的项目,也是国内第一个运用了自然语言处理、视觉图形处理和机器学习技术的写稿机器人。
但这些我们熟悉的 AI 项目,只是单独单项训练计算机具备某一项能力,下棋、翻译、图像识别等,而微软的情感聊天机器人正在尝试解决传统 AI-Complete 最难解决的部分——“全时感官”能力,这也是小冰区别于传统的语音助手最显著的特点。“全时感官”全面地识别对方输入的文本、图像、语音、乃至视频信息,最大限度地拟人交互体验,通用化 AI 的推进,才有能力完全打破人工智能的“工具”定位,它才能从一个聊天机器人演变成另一个层面的东西。
形魂相容
目前,微软对小冰架设的未来道路正在慢慢铺开。他们打造了一个插卡平台,像《超级陆战队》里的大白那样,通过插入各种“技能卡”来实现小冰机器学习和处理能力的不同应用方向;人形机器人Asimo也已经能依据人类的声音、手势等指令,来从事相应动作,此外,它还具备了基本的记忆与辨识能力。
毫无疑问,人形机器人和人工智能的“形魂相容”才是未来机器人发展的目标。而从它“修炼”成他/她,到底还需要多少年呢?