前文提到机器未来在有确定答案的事情上可以战胜人类,并不等于把人类说得一无是处。相反,人机配合才能有更好的效率和输出。在今天,即便大多数的工业化生产线实现了流水作业,但多少仍雇佣一些工人:而这些工人其实是操作机器的高手,同时也是生产线上把控质量的第一道关。倘若机器出现误操作,要靠人及时介入,调整规格或者终止机器,否则机器将源源不断地生产废品。
在人机互动中,机器能理解人类的指令,并不是先天的,而是经过人不断地训练和调试。大多数的机器是一个系统,输入一个种子之后,就会产生固定的输出结果。比如把大米丢进电饭锅,会出来米饭;把衣服丢进洗衣机,出来会是干净的衣服。但机器本身并没有太多的判断能力:比如洗衣机即不会判断你的衣服是脏还是干净,也不会判断你的衣服是织物还是羊毛应该用什么力气洗——一切都来自人类的经验。稍微智能一些的机器会输出不同的规格:比如既可以做米饭,也可以做粥或者熬汤,但背后的原理,依然是给XX食材提供YY火候,还是由人类通过自己的经验,去进行这些设定与挑战。机器只是加速了实现的途径,减轻了人的负担,又回到了之前的那句话:凡事若是重复三遍以上,就该有自动化过程。
除此以外,另一个接受信息的维度是信息的变化和复杂度:即在这一个输入的问题中,有多少种可能的变化:最早的输入是物理按键,比如计算器上的数字键或者是ATM取款机上的密码键,这种情况下其实机器接受输入只有两种结果:按了还是没按。比如按下数字1,就会被接收到,并反映成为1的功能;按下数字0则是另一种变化…… 在有限的组合中,机器从来不犯错误,我们从未见过计算器的计算结果不对,抑或是ATM把你的账户余额算错等等。这种靠谱的表现也被应用到了一些高风险的日常生活中,比如汽车:按喇叭就一定会响,按双闪按键一定会亮灯,所有的操作都给人以安全感,让人可以放下心来。
但是随着机器的智能化,有限的输入将不再能满足人们的需要了,贪婪的人类认为需要满足更多的需求才好。于是除了电脑键盘,鼠标被发明了:你可以点击屏幕的任何地方(可能是几百或几千万像素);功能手机演进到了智能手机:无需按键,屏幕的任何地方都可以作为指令。这还不算,现在更出现了语音输入方式,无论是快速创作,还是调戏Siri,大家都乐此不疲。
人类的生活就是在数以亿计的可能性下几乎无限的组合。这种无限输入,其实正是我们生活中的真实体现。比如每个人可能每年走不了多少不认识的路,因此用导航的时间屈指可数;但是互联网把所有需要用地图导航的人都放在了一起,这就形成了海量的需求。一个极端的例子,还有翻译软件。除了以外语为职业的人之外,日常人们用到的翻译机会其实少之又少:而且语言这种东西进化极慢:人年少时怎么说话的,年老了八成还是同样的语言,不太会变化。在这种默认的场景下,自动化的翻译就应运而生:因为机器只要”学习一次“,便可以有终身记忆。但是人类的语言是千变万化的,同一个字在不同环境下有不同的意思,不同的字组合起来,意义又会截然不同,即便机器攻克了上面这些困难,人类说的话还会因为断句不同有不同的意思,比如下面这个:
如果较真,确实是有“你/好无聊”以及“你好/无聊”这两种表达方式(如果深究还可能有更多种);人类通常倾向于第一种,但机器比较难理解这种语境背后的逻辑,在什么情况下是哪一种,于是形成了机器与人美丽的误会。而有些时候,甚至完全颠倒了本来的意思,比如下面这个(之所以贴中文译日语翻译,是因为中译英机器人做对了,没有中招),即便在人类的语言中也可能会闹出笑话,机器自然无法避免:
如果你发现过几天这两个翻译软件修改了上面的错误,请千万不要吃惊,这只是庞大系统里的一个暂时未被发现的bug而已。对于程序员来说,一旦知道了问题在哪里,解决一点都不难。。
上面说的是机器误会了人的意思,这也是无限输入所面临的终极问题。想定义一个原子集合,又把所有的操作变成原子集合的叠加,是一个理论上的可能,而在实现中无法达成:因为复杂问题中的维度太多,如果你需要确认每一个维度,最终人类会因为没有耐心而放弃与机器交互,更倾向于找同类解决自己的问题。
一个例子,就是越来越普遍使用的自助语音服务系统。
想必你有这样的经历:
“欢迎致电XX,普通话请按1,English service press 2”,我们选择按1;
"国内机票请按1,国内酒店请按2,国际…… " 我们再选择按1;
“机票预订请按1,机票查询请按2,退票请按3…… ”;
以上的各个问题,是不同维度的输入请求(语言、服务、功能),每个问题几乎被分解成了互斥又互补的几个选项:比如听中文就不能听英文,机票服务和酒店也无法一起操作。但是毫无疑问,你如果用系统背后设计的机制去做一些复杂的服务比如改签,机器并无法自然完成,流程会让人抓狂。于是乎我们都期待这个菜单最后有个“人工服务请按0”。通常,令人更加失望的是,人工服务一般要等待好久,甚至干脆就没人听。
所以,话务员不用担心失业,需要你们的大有人在。一个真正完善的自动语音应答系统,应该具备识别能处理的业务和不能处理的业务。能处理的自动处理,不能处理的转为人工。
还是那句话,人机合作才是王道。
#413-Haomian-一齐听棉讲故事#+橙子学院码字岛第14篇作业