你知道的
我是个学心理学的营销人
且是营销人里无所不能的Account
为了过起大数据指导下的
21世纪逗逼青年的美好生活
今年开始解锁了自己的编程技能
年轻的时候特别喜欢的一个词作者,香港著名填词人------林夕。恰逢前几天是他的生日(当然因为重度拖延现在早过了),所以便有了这篇班门弄斧的文章。
原来过的很快乐 只为一人未发觉
如能忘掉渴望 岁月长 衣裳薄
无论于什么角落 不假设你或会在旁
我也可畅游异国 放心吃喝
---杨千嬅 《再见二丁目》
那个写出4000多首歌的作词人,那个感动了无数人,那个被网友称为“虽不认识但最了解我”的林夕,在他的歌词里,到底写的是什么?
作为大数据时代的营销人,为了认真而严肃的研究这个问题,我捡起那从入门到放弃的Python,写了个爬虫。找到了网易云音乐里林夕作词的500多首歌,爬取了这些歌的歌词。
林夕的这些词,给了率真感性的张国荣,给了清冷空灵的王菲,给了伤心孤勇的杨千嬅,也给了沉郁深情的陈奕迅。这四位的歌,在这500首当中占了将近一半。
我就是我 是颜色不一样的烟火
天空海阔 要做最坚强的泡沫
我喜欢我 让蔷薇开出一种结果
孤独的沙漠里 一样盛放的赤裸裸
---张国荣《我》
针对这500首歌的近20万歌词的进行一顿猛如虎的操作,发现林夕的词中出现最多的意象是“感情”、“情人”、“眼泪”、“爱情”、“朋友”、“故事”。这与大家对林夕的印象一致,林夕的词描绘的最多的确实是爱情。
而对于这些意象,为了探讨林夕想表述的是什么,我对这20万歌词中的所有动词进行了排序分析,发现出现最多的是“没有”、“得到”、“需要”、“知道”、“不能”、“忘记”、“不能”、“没法”、“不想”、“失去”。可以看到基本上都是否定,即描述的是没有得到的爱情。
然后我还分析一下时间代词,发现从时间的维度上来说,林夕描述的最多的是过去(包含过去、从前、当初、往日、旧日等词)、而后是今天(包括“今天”、“今晚”、“现时”等词)和未来(包括“未来”、“明年”等词),而提的最少的是明天。也就是说林夕的描绘的那些过去被伤的很深的感情,基本在当下是无能为力的,只能期待在遥远的未来能够解决。
这里插播一句,我同时也分析一天中早晨、黄昏、晚上、夜深出现的频次,没有发现显著性的差别。
最后我将林夕这近20万的歌词进行了词频分析,得到了上面一张图。综合来看林夕描绘的就是一个没有得到的我们,在过去被感情伤的很深,但在当下又无力解决,只能卑微的继续爱着。
一言以蔽之,林夕这500多首歌,近20万多歌词,不过是换了500种方式表述的求而不得。而这一切林夕在《似是故人来》里也表述的很深刻:但凡未得到,但凡是过去,总是最登对。
在有生的瞬间能遇到你
竟花光所有运气
---陈奕迅《明年今日》
THE END.