我所说的一切都可能是错的!
即使你赞同我的观点,你的生活也不会因此有任何改变!
除非——你采取了相应的行动。
(这是书先生在简书的第9篇文章。本文约1700字,请花4分钟来阅读。)
一开始我想说“像百度一样学英语”,毕竟google这个网站是否存在还是个谜。但转念想到,百度似乎英语不太好,那就还是姑且使用这个主页一般显示“404 not found”的网站吧。
搜索引擎的空间换时间
Google的老本行是搜索引擎,和我们学英语有什么关系?这就得从搜索引擎的原理说起了。别被这句话给吓着了,以为下面我会抛出长篇的理论。绝对不会——因为我其实也不懂。不过,我可以很有把握的说,Google只可能采用下面两种方法:
当用户输入搜索的关键字时,Google立马开动自己的算法程序,全网搜索,然后把结果呈现给用户。这种方法需要极先进的算法和服务器极快的处理速度。
Google平时放出自己的网页蜘蛛,全网到处爬,把爬到的网页全都建好索引,存储起来。一有用户搜索,就把已经存好的东西直接呈现给用户。这种方法需要超大的存储空间,但对速度要求就会低一些。
大家觉得Google会用哪一种呢?很显然,是第二种。因为无论多么牛逼的算法、无论多么逆天的处理器,也无法实现实时全网搜索。而第二种方法把计算和搜索实际上放在了用户搜索之前,而当需求产生时,调用的是已经存储好的结果。
这是典型的“空间换时间”,时空可以转换在Google身上得到了完美的体现,相信爱因斯坦老人家可以含笑九泉了。
语言使用中的空间换时间
如果把Google平时的爬取看做输入,把响应用户的搜索看做输出,那么Google的工作原理和语言的输入输出有异曲同工之妙。
当我们在实际生活中使用一门语言时,我们有两种输出方式:
根据语法,用已经掌握的词汇来临时计算出一个合乎要求的句子。
把平时背过的可以满足要求的句子直接调出来。
很显然,第二种方法效率要高得多。可是,很多英语学习者实际上采用的是第一种方法。因此,他们总觉得用英语去交流是一件很困难的事情,因为临时计算很耗时间,而且经常算错。
比如我一个学生就用过international tissue这种短语。他想说“国际组织”,他记得国际是international,组织是tissue,所以他“计算出”一个international tissue。可惜,tissue是肌肉组织,神经组织的那个组织。如果他平时直接存储过international organization这样的短语,直接调用,就不会闹这样的笑话了。
以第一种方式去使用语言,不但自己痛苦,对方也痛苦。你每说一句话都要算半天,考虑过对方的感受吗?就好像,你在Google的搜索框里键入一个关键词,Google告诉你请等候一小时,我正在搜索,你还不得把电脑砸了?
所以,我们得用第二种方式。
向Google学习,在平时多储存数据,最好是单位更大、能直接响应需求的数据。比如,不能只背单词,更应多背词组,最好多背文章。
假设可能的需求场景,模拟在这些场景中你可能的反应。比如就一个话题自言自语或者每天写点东西。
Google、人脑和语言
实际上,以空间换时间的做法更符合人脑的特点。和机器相比,人脑在计算速度上其实不占优势。但人脑几乎有无限的存储空间,至少现在还没有发现它有上限。
就语言本身而言,“有限规则无限应用”这种说法,也不全然正确。符合语法的东西不见得符合语用。近年来越来越多的语言学家认为,语言使用更偏向于概率,而不是规则。比如,晚安我们用good night。单从语法上来说,似乎nice night, pleasant night也说得过去,但我们却不会这么说。
简单的说,你每天说的的每一句话,都很难说是全新的,可能前面已经有几万人在相同情境下说过一模一样的话。
既然是这样,我们多记一些前人用过的句子,在相同情况下,直接调用不就行了。这不但符合人脑的特点,也符合语言的特点。
就算那些规则比语言还“有限”的棋类游戏,比如象棋、围棋,学习者也是通过记忆大量已经用过的定式来提高自己的水平,只有极少数人能够在战法上有所创新,就像只有极少数语言使用者能够创造出让人耳目一新的句子。
当有人问你根号2等于多少时,最快的方法不是掌握开平发的算法,而是提前背下来,然后直接说出答案。据说,李开复就干过类似的事情,给老师留下了深刻的印象(详见李开复《世界因你而不同》)。可能就是对空间换时间有深刻的认识,他才当上Google大中华区的总裁的吧。