数据分析30万字民谣歌词,终于搞清楚游吟诗人们在吟什么

朋友圈似乎被赵雷刷了屏,“成都”这个词仿佛当年的“安河桥”。很少听民谣,印象最深的民谣歌手是李健,因为家庭聚会时小姨总是一脸花痴地看着电视夸他多么帅。

有点好奇这群流浪的现代游吟诗人到底在吟什么,所以尝试从数据分析的角度来看看。

参考了网易云音乐和虾米网的「热门民谣歌曲」和「热门民谣歌手」,咨询了朋友圈的几位民谣青年,选出10位分析对象:李健、赵雷、李志、好妹妹乐队、宋冬野、陈粒、左小祖咒、尧十三、郝云、周云蓬

写了个爬虫,抓取了QQ音乐上这个歌手的所有歌曲。这里其实犯了个小错误,本来想抓前十首热门歌曲,可是错设成了全部歌曲,但其实工作量没差多少,就将错就错了。

就这样,采集了568首歌曲,共计30多万字歌词。扫一眼已经能感觉到淡淡的忧郁,为了能保持理智地敲键盘,我点开了周杰伦。

好,开扒>>>

正能量满满时,听好妹妹、郝云;忧郁愤懑时,听陈粒、左小祖咒。

情绪通常通过形容词来渲染,通过自然语言分析比对词库,综合“正面/负面”标签和词频权重,给每位歌手的情绪风格打分,正数∝正面情绪,负数∝负面情绪,条形长度为情绪强烈程度。

情绪风格

好妹妹乐队和郝云简直打了鸡血,抑扬激昂的唱腔唱着正能量满满的内容,颠覆了我以为民谣就是惨兮兮的偏见。

最近很火的赵雷算是平平淡淡不疾不徐的一挂,不鼓动你也不替你说出心中郁结,而是悄然无声地感染你。

听陈粒、好妹妹乐队的歌,就像看电影。

有些文字特别有画面感、既视感,眼睛在读文字,脑中已浮现出电影般的画面,仿佛已置身其中,进一步加深情绪氛围、产生共鸣。

马伯庸在知乎的课上,道出了增加小说画面感的写作秘密:多写动词。

画面感

由于每首歌的字数不一,所以按动词在个人高频词里的占比来排序。对比前一张图来看,陈粒和好妹妹乐队都是利用画面感来煽动情绪的高手。

民谣青年对北京最扎心,你认识的民谣范儿朋友30%漂在长三角。

北京在民谣的世界里占有绝对的地位,随其后的是上海和南京。北漂嘛,比较容易理解。长三角作为抽血重点区域,交织着无数人的青春与理想,人前上进拼搏,人后忧郁寂寞。

民谣最爱唱的城市

老实说,把“成都”换成别的北方城市,唱起来其实差别不大。但要是换成广州,把“走到玉林路的尽头,坐在小酒馆的门口”变成“走到上下九的尽头,坐在茶楼的门口”,顿生一股安逸退休生活的feel,一点都忧郁不起来了。

换句话说,民谣放在哪个城市都可以,但只要简单的A/B测试,即可得知放在北京、上海这些城市,最有代入感、最受欢迎。

民谣歌手最常念叨的地域

“我会背上吉他离开北方——宋冬野《斑马,斑马》”,我女神宝刀shishi也说过“南方是我的经验”。

对于民谣青年来说,南方或是出身的地方,或是想逃往的地方,在那里,有亏欠过的人,有不说是结、说了是疤的回忆。

身在寒冬,心向春夏。奋斗虽苦,但含着泪水,也满怀希望。

民谣青年对春夏这个意象的向往,可以延伸解读为他们寄望于明天。骤眼看来,他们似乎是无病呻吟故作姿态。

但自舔伤口之余,他们忧伤但不消沉,或是有强烈的信仰支撑、或是转身已无后退之路,原因不一。无论是哪个原因,未来并不灰暗,反而充满可能。

民谣最爱的季节

用户画像

假如把一首民谣比作一部电影,那电影主角会是什么形象呢?综合透视30万字歌词,洗出140个关键词,选前20个高频词,大胆猜测出——

男,活跃在北京或长三角,对青春和理想有情怀,外表乐观阳光,内心孤独忧伤,重朋友,单身狗,有几个纠缠不清的前女友,处于职场奋斗上升期。

「望着夜空概叹时光飞逝,我回忆起曾经的青春和奋斗的理想,心中堆满忧郁和孤独,此刻你能否给我一个拥抱?」

民谣高频词云

ps

  • 自然语言分析情绪做得比较粗糙,举个栗子,“失去”>>负面(负值),“希望”>>正面(正值),“失去希望”>>负面,但分词自动求和的结果视各词的权重可正可负,导致误差。

  • 各音乐网站上,每首歌曲的作词作曲、乐队成员姓名基本都有详细列明,体现了对版权和音乐人的尊重,值得一赞。

  • 顺便对比了几大音乐网站的搜索算法和用户体验,有机会再写吧。网易云音乐确实是做得最好的,是我技术问题没抓取好。

  • 不要纠结工具,能玩溜excel已经能做很多东西了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容