更新版见 知乎专栏
先旨声明:
- 本文讨论的话题是互联网上的「音乐推荐」服务,可以把它拆分成「音乐」和「推荐」两方面来思考,两者间又有紧密的联系。有这个意识有助于理清这个话题。
- 本文涉及的「推荐」是广义的推荐,基本上除了用户主动通过歌曲名、歌手名等来搜索他确定想听的音乐之外的范畴,都在讨论之列。
- 全文主要还是从产品的角度探讨,不涉及具体的算法细节(我也不懂),只会用通俗的方式简单介绍下最主流的推荐算法思路。
- 虽然算不上业内人士,我还是自信对这个话题有一些观察和思考;同时也很自知一定还漏掉了很多重要部分,真诚欢迎大家讨论指正。
Web 1.0 时代
时间节点大概是在百度 mp3 搜索、千千静听这些当时的音乐玩家在站稳自己的领域(音乐下载、音乐播放等基础服务)后,开始给用户推荐音乐。我认为最原始的音乐推荐形式就是我们所熟知的排行榜、按歌手划分歌曲、按风格划分歌曲。是的,这几种形式在今天的互联网音乐服务中仍然非常常见,为什么?因为它们能够解决当前大部分音乐受众的主要需求。简单分析一下:
- 各类排行榜:不管是什么排行榜(热歌榜、新歌榜,亦或有个「小众歌曲排行榜」),其本质就是大热门、主流。你可以把它理解成最初级的「大数据」应用,不考虑人的个性需求,把最热门的东西推荐给所有人。
- 按歌手划分/按风格划分:一方面,限于展现形式,它们只是一种特别的排行榜;另一方面,结合我们听歌的经验,按照歌手或风格来发现新歌是最「不容易错」的方式。甚至看过一些段子,诸如「如果有一天我因为下载音乐被关监狱,请把我和喜欢金属乐的人关在一起」之类。
所以总结来说,最原始的互联网音乐推荐,其实仅仅只是利用了互联网的革命式的传播性,推荐本身没有任何新意,仍然利用了大热门和人们听歌的惯有方式——歌手或风格。
探讨话题 1
假如只能有一种分类方式,你是愿意按照歌手来分类,还是按照音乐风格分类呢?有什么独到的见解吗?
从 PGC 到 UGC
前进到下一类音乐推荐的形式——专题。PGC 就可以理解成是专业编辑人员做的专题,把一些在某方面有相关性的歌曲编辑到一起进行「打包」推荐。而随着 Web 2.0 时代的到来,这个制作权已经下放给了普通用户,用户可以根据自己的兴趣和乐历制作任何主题的专题,也就是所谓的 UGC,用户产生的内容(严格来说,用户制作的精选辑在排版的美观、灵活性上和 PGC 制作的专题还是没法比的,但它不是这类产品的核心价值)。不仅制作权,甚至连热门推荐的位置,也逐渐从 PGC 让给了优质的 UGC。现在这种用高质量 UGC 做 PGC 的模式非常非常主流,互联网音乐服务也一样。鼓励 UGC 做音乐专题的国内典型案例有虾米网的精选辑、网易云音乐的歌单。值得一提的是,国内仍以 PGC 为主的音乐服务中也有做出不俗成绩的,例如运营十多年的落网,至今仍坚持着高质量的独立音乐推荐。
音乐专题制作从 PGC 到 UGC,音乐推荐源获得了大大的丰富,而且在有效的设计机制下,获得展示的音乐内容质量只升不降。但是这个过程仅仅只是丰富了内容源,本身仍然没有改变音乐推荐的机制,用户获得信息的途径仍然是搜索或者浏览热门内容(类似歌单排行榜)。接下来我们一起看看目前最主流的音乐推荐机制。
顺便提一下,如果你仔细想想,我们已经提到的几类音乐产品形式,从最原始的专辑,到榜单,到专题,以及后面将提到的电台等,它们的本质是不是都是歌单?!不同类型的歌单之间的核心区别仅仅是关联其中歌曲的原因不同。一张概念专辑可能是围绕一个故事的十首歌组成,一个专题可能是由一个歌手的几首代表作组成,等等。目前国内音乐产品中对歌单这个概念执行得最彻底的是网易云音乐,通过使用它,你可以具象地理解我这里提出的「一切皆歌单」的观点。至于说基于这个观点能做什么文章,甚至该不该做文章,以后有机会再单独讨论。
探讨话题 2
整理相关内容时从分析的角度又去看了下最新的豆瓣 FM,它从私人电台到兆赫再到节目的一系列发展历程我都是很清楚的。不过刚才看了一眼目前的产品形态,兆赫和节目在产品设计上做了很明显的解耦(也就是故意减少两者的联系)。在我印象中推节目的冷启动似乎就是把兆赫给转成节目。这是一个非常非常非常有意思的现象,很想听听思考过这个问题的人的见解?
主流的音乐推荐机制(算法)
第一家以通过算法做音乐推荐而出名的公司叫做 Pandora,而国内在(音乐)推荐算法方面的领头羊则是豆瓣,我们简单看下它们的几种不同的推荐方式。
- Pandora 开创性地搞了一个「音乐基因工程」,简单理解就是它把一首歌曲「理性」地打了很多标签,维度非常广泛,可能有布鲁斯(歌曲的音乐类型)、吉他(歌曲用到的乐器)、欢快(歌曲的风格)等等。它的出发点就是认为音乐的相似性是可以通过科学数据分析出来的,而不是人们常认为的「听音乐是件感性的事情,歌曲之间没法比较」。这样,歌之间的标签重合度越高,Pandora 的算法就会把它们作为相似歌曲来推荐给你。
- 以下两条都是基于大数据的思路,和音乐本身没什么联系,普遍适用于各个领域,也可以应用在不同的音乐类型上(如歌曲、专辑、歌单等),是音乐推荐算法的本源。假如有 A、B 两个用户,它们都喜欢了相同的 100首歌曲,另外 A 和 B 分别喜欢了几首不同的歌曲,也就是说他两音乐喜好重合度非常之高,那么算法就会把 A 另外喜欢的几首歌推荐给 B,B 另外喜欢的几首歌推荐给 A。
- 假如有 X、Y 两首歌,其中 X 被 1000 个人喜欢,而其中的 990 个人都喜欢了 Y 这首歌,也就是说喜欢 X 和 Y 的用户重合度很高,所以算法会把 X 和 Y 视为相似歌曲,对于喜欢 X 的用户就可能接着给它推荐 Y。
在推荐算法的基本原理不会有大的更新的前提下,一方面可以优化算法中的各个细节参数,一方面可以再进一步扩大音乐推荐的维度(豆瓣 FM 推荐中有过一个例子,在星期五给推荐了一首歌名带了 Friday 的歌。这个在我看感觉都有点脱离音乐本身了... 因为这一块还涉及到产品形式的变化,也就是说它其实是另一种有不同关联歌曲理由的歌单,所以我们挪到下文详述),还有一方面就是在推荐内容相同的前提下给用户更好的心理感受。例如虾米音乐和豆瓣 FM 每天都会根据用户的音乐喜好自动生成一个歌单(准确地说虾米出的这个功能比豆瓣早了得有一年半载),但我自己的使用感受,包括看到的用户评价,应该都是对豆瓣的这个功能满意度更高。
为什么呢?因为豆瓣 FM 对每首歌都给了一个简单的推荐理由。这个功能的出发点其实是心理层面的,可是带来的效果也许比算法上的改进要好很多。(Well, that's partly why we need PM...)
探讨话题 3
因为我毕竟没做过算法,也不是业内人士,对音乐推荐算法的理解更多还是看资料以及从产品行为反推,也许已经过时了,也许猜错了。如果除了上述提到的三种思路以外,还有其它重要的推荐算法,敬请指教。
也欢迎大家聊聊你觉得算法最好的音乐服务,最好能举些例子。单纯说你喜欢哪家音乐服务的推荐没有什么讨论的意义。
下文预告
其实剩余要谈论的内容我已打好了草稿,限于篇幅,第一部分暂且写这么多。根据讨论的情况在合适的时候更新第二篇。相比第一部分,第二篇涉及的话题更加新鲜,所举案例更加创新,敬请期待。
- 给歌单再找一个理由:从场景说开去。
- 为什么音乐推荐转化率低:因为音乐是靠听的;消费音乐的成本太高。
- 用音乐社交来做推荐:真的是个伪命题吗?
广而告之:
我在做一个音乐站点,至少从解决方案的角度来看尚未见到市面上有其他人在尝试(国外也没见到,不过我国外产品见得也不多...)。如果你因为我的一些音乐观点觉得不妨试试这个新产品,又碰巧喜欢一个外号叫做 slowhand(慢手)的著名歌手,欢迎通过任何方式联系我,我会给你 Demo 的地址。