一、介绍
Google Books Ngram https://books.google.com/ngrams
提供了谷歌图书扫描并数字化的部分图书(占人类出版书籍的4%)的Ngram数据。你可以查询从1800年到现在,所有出版物中一个词汇出现的频率变化曲线。(至2012年,已完成超过520万本书,包含5千亿个单词。)
- 粘贴一个知乎对于Google Ngram的描述,写的很详细,供参考。
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
https://www.zhihu.com/question/26166417/answer/32329856
二、我感兴趣的词汇图标展示
我查找的关于人类生活的基础词汇,比如幸福,快乐,婚姻,自由。中英文的词汇曲线对比,某种程度上显示了一个社会文明的发展进程,以及不同年代人们更乐意讨论什么。
还有一些词汇,如大数据,数据挖掘,都是近些年才出现的。互联网的出现催生了很多新事物,高昂的曲线说明他们正蓬勃发展。
世界的变化,可以浓缩在这弯弯曲曲的图谱中。