阅读及笔记时间:2017年2月,26日,约3.5小时;
阅读书本:《可视化未来》;作者:【美】埃雷兹·艾登,【法】让-巴蒂斯特·米歇尔(译:王彤彤,程学旗);2015年9月第1版;浙江人民出版社;P1-223页;
阅读目标:大数据是如何作用于人文趋势研究的?
阅读方法:影像阅读,概念精读与案例泛读
整书笔记及感想:
阅读2.5小时,笔记1小时。
作者艾登与米歇尔在本书中提出了“文化组学”的概念,成为了世界数字人文学的领军人物。“文化组学”,这是一个非常新的概念,也是一个非常有意思的科学研究方式。那么,它是什么?它又是如何产生、如何作用于人类学研究的?
文化组学,是一种看待历史变迁的新视角和研究语言、文化、历史的一种计量方法。它依托“谷歌图书”项目,运用n元词组词频查看器,对过往出版的书籍(截止成书,该项目已录有3000多万本书籍,是具有无可比拟的广度与长度的大数据库)词汇、词组进行探究、分析,从而开创了该大数据在英语语法演变、词典如何犯错、人们如何成名、政府如何压制思想、社会如何记忆和遗忘,以及文化如何以一种确定性方式运转等方面的应用。最后还探讨了如何使该方法可预测人类未来。这样一种看似小众的研究,实则在未来大有可为的研究,令我不得不感叹外国人的创新思维能力之强。
举例来说,英语中有100多不规则动词,学过英语的人都知道,这些动词的过去式是需要特别背诵的。那么,为什么英语中会有这些恼人的不规则动词呢?通过n元词组词频查看器对过往几千年的书籍进行计算、分析发现,原来,现在的不规则动词在当时是主流形式,因为英语来源于原始的日耳曼语(原如印欧语的后裔)它继承了动词词形变化的元音变换模式。在那个时候,规则动词才是例外。经过漫长的时光,元音变换规则逐渐消亡,新规则-ed蒸蒸日上,新规则的词越来越多,只剩下最活跃使用的100多个不规则动词未被消灭。哈,原来如此!竟然通过大数据解开了这个谜底。而书中解读到的另一个例子,比如审查运动对文化的影响程度,通过n元词组词频查看器透析大数据,也一目了然,在曲线图上可以很清晰地看到是什么时候某些词和短语突然消失了。通过这个,人们可以了解到当时有哪些人和事物受到了压制。除此之外,n元词组词频查看器甚至还可以编撰大词典而不用担心遗漏,相比人工编撰,它能捕获更多低频但是有用的现代词汇;它甚至还能分析人们成名的趋势以及文化未来运转的趋势…我相信,它的运用范围可以更广泛,也许在未来可以据此研究中国文化的变迁,或者是更多与我们生活切身相关的应用上来。
另外,谈到它的产生,引发了我对教育制度设计的一点思考:
据众所传,美国的教育方法是从小培养发散性思维、创新意识,美国的大学又是宽进严出,所以他们多出科学家、创新家。而当我读到“当时在我们看来,设计出这样一种新的观测方式只是有助于我们从哈佛大学顺利毕业。毕竟对于我们这些正在读博士学位的低收入、受教育过度的人而言,能顺利毕业就是我们唯一可以期盼的事了。”这段话时,我终于明白了,其实,少时的培养是一个积累,但大学时期的要求也同样重要。假若哈佛大学对学子们的要求不是那么苛刻,他们可会有今天的成名?可会水道渠成地开创了“文化组学方法”。答案是:多半不会。在国内大学,大多是12年寒窗苦读一块敲门砖敲进高校,然后混毕业。白白浪费了天之骄子们的青春风华正茂,原因便在于毕业要求太低,毕业水份太多。若是同样收紧毕业门槛,想必不乏创新与创意吧?