一、 算法想要达到的目标
在文章的开头,我们需要明确一下我们设计算法的目标,这将会主导我们接下来讨论问题的方向以及深度。
我认为酷狗短视频主页的主要作用有如下三点:
1. 营造氛围。主页作为用户观看短视频的入口,首先要营造出某种氛围,在潜移默化中引导用户的情绪。举个例子,看见各种张灯结彩的画面就会感到华丽喜庆,看见各种美女会感觉心情愉悦放松,看见很多血腥恐怖的画面会感觉害怕。酷狗直播的核心是音乐,因此我们在首页安排大量的唱歌、乐器或伴乐舞蹈来营造一种充满音乐的轻松氛围。
2. 推荐精品内容。好看用户自然会喜欢、会多看。
3. 为主播吸引观众。短视频是主播集中体现自己的特色以及风格的途径。通过短视频,让用户短时间认识主播并对主播产生兴趣,进而进入其直播间,完成短视频和直播之间的流量引导。
二、 短视频用户画像
确立目标之后,我们再来看一下我们的算法主要服务的人群是谁。只有了解我们的目标用户,才能做到有的放矢。我个人认为,从目前的市场形势观察,如果用户主要想要观看音乐类短视频,多数会选择抖音这类专注于短视频的平台。而酷狗直播的短视频功能是辅助直播功能的补充形式,因此主要用户也应该是从直播平台导流过来的用户。因此,我们的数据由艾瑞咨询和酷狗联合发布的《2018 年中国音乐直播用户白皮书》得到:
1. 音乐直播用户以男性为主,占比超 3/4。
2. 年轻化,30 岁以下用户占比超七成。
3. 用户集中在三线城市城市,占比高达 64.2%。
从以上数据,我有如下 2 点思考。
1. 从性别来看,女性用户主要是主播的主体,而男性用户主要是观众的主体。因此首页的视频作者性别占比也应以女性为主。
2. 年轻化用户喜欢追求美丽的外表以及新鲜刺激的内容,因此视频作者形象应漂亮大方,同时内容应多元化,以歌曲舞蹈类为主,其他形式均衡穿插。
三、 算法具体描述
个人认为,酷狗直播短视频算法主要基于如下 3 点:
1. 视频与用户画像的匹配程度。用户数据包括①性别、②年龄、③近期观看视频的种类、④观看各类视频的时长等等,其中③和④的权重较大,综合计算后与与视频进行匹配,匹配程度高则推送。
2. 热度(赞、评论、转发等)。主播正在直播时,其短视频应优先推荐。因为短视频的作者多数也是平台签约主播,我们希望为每一位主播提供公平的展现机会,因此可以对视频的热度权重设定峰值。当热度达到一定阈值时,则权重随人气逐渐下降,重新达到平均区间。这样可以保证不会持续为用户输出头部视频,保证每一位作者的新视频都有展示的机会。
3. 发布时间。默认发布时间较近的视频。刚发布时,时间权重较高,随时间推移,时间权重逐渐下降。这也可以激励主播多利用空闲时间拍摄短视频,为自己提高曝光度。而除了以上三种计算方法外,我想额外增加一种有权重变量——主播热度变量。变量的赋值方法为:
主播热度变量=(主播人气*0.5+主播直播时长*0.3+主播受打赏额度*0.2)
注:需要对“主播人气”、 “主播直播时长”+“主播收打赏额度”做数据统一化处理,使它们处于相近的数量级。
变量使用方法:主播拍摄视频时,会同时计算主播的热度变量。推送时,主播热度变量也应作参与推荐算法的计算。
设计目的:首先,主播热度变量高的视频是基于主播人气计算得出,人气高的主播必然有其优秀的特点,一定程度上能够保证视频的质量较高。
其次主播长时间直播,能够说明主播的工作态度,我们有理由相信,努力工作的主播,其能力会不断提高,发展潜力更大。我们需要扶持那些在直播行业中默默坚持的主播们,这是平台的责任,也会带给平台良好的口碑和形象。
最后,受主播打赏额度影响,会促进粉丝的消费,提高实际收益。
此算法一方面能为主播们提供公平的竞争环境,促进主播们的能力提升,检验主播们的工作态度;同时也可以为用户们推荐更优质的视频,提供用户更好的体验。