达观数据已服务近两百家不同的企业,不仅有互联网企业,也包括一些大型传统企业,比如中兴、华为。此次主要针对一些细分的互联网垂直行业来说明个性化推荐的作用,主要为直播、文学、社交、视频、音乐和资讯六个行业。为什么以上六个互联网垂直领域的用户对个性化推荐需求这么旺盛?最重要的一个原因是这些平台每天产生大量的内容导致用户信息过载。
以达观服务的一个直播企业为例,它在整个游戏直播领域排前三,工作日早上十点左右的非黄金时段同时在线游戏主播有五千多个。面对这么多主播同时在线,很多人会选择困难。再比如达观服务的一个中型文学小说网站,每天新增小说六百多篇。与之相比,资讯网站的内容产生量更是海量,比如WIFI万能钥匙日活超过几千万,每日资讯的增量逾几十万。短视频如日总天,达观在短视频行业的用户是中国最早做UGC短视频的企业,日增UGC短视频量高达几十万。用户面对如此多的选择,无所适从。
由此可见,上述几个行业对于个性化推荐的需求是非常迫切的。纵观所有的客户,无论它是来自哪个细分的领域,客户最关心的且具备普适性的指标是如下四个:点击率、停留时长、人均pv、转化率,重中之重则是前两个:点击率、停留时长。
停留时长受客观因素和环境的影响,在不同的应用场景里,它的横向对比是很难做到的。所以很多时候,点击率是更公正公平的一个评判标准。尤其是接入个性化推荐的初期,点击率是达观数据最主要的评判指标。
不同的行业不同的应用场景,客户关注的细分指标也不尽相同。短视频客户更关注播放完成率、人均视频观看数量。播放完成率就是一个用户点开一个短视频的播放时间除以短视频总时长,这是衡量用户对一个短视频是否真正感兴趣的一个重要指标。文学类客户更关注平均阅读提升和付费转化。资讯类客户更关注深度阅读和新资讯的曝光率,不同客户对于深度阅读的时长不完全相同。
那么达观数据个性化推荐是如何帮助客户做到重要指标提升的?
以直播行业为例,说明其存在的四个主要问题。
第一个问题是主播越来越多,小主播得不到曝光,且主播同质化严重。直播平台的话,为了维持平台稳定的收入,通过编辑推荐,会把大部分的流量都引到还是以前比较红的热门的主播身上。新进主播曝光的机会则比较少,流失率就会非常高。
第二个问题是无法深度挖掘大量的用户行为。直播平台的用户一般分两类,一类是未登录的游客用户,另一类是登录用户。如何挖掘分析一个随便闲逛的用户行为,把他变成注册用户并且付费充值,持续不断的在平台上送礼,要对于这些行为进行深层次的挖掘,这个是比较难的点。
第三个问题是难以快速把握用户兴趣和口味的变化。很多用户随着时间和内外因素变化,兴趣都是随时变化的。怎么实时应对变化,也是个性化推荐需要帮助平台解决的问题。
第四个问题,也是最重要的问题,就是冷启动。在没有任何用户行为的前提下,用户第一次进入直播平台时,就能向其推荐喜欢看的产品,增加他的停留时间。
针对上述四个问题,达观个性化推荐的技术实现如下:
1)对平台用户进行分析。一般来说一个产品接入达观平台,会涉及两组数据。就直播平台而言,就是主播数据,包括静态数据和动态数据两部分。静态数据就是主播的等级、性别、年龄、粉丝数等。动态数据是主播的播放时长、直播时段、直播风格等。
2)对用户进行画像构建。用户在平台上有浏览、点击、关注、留言、发弹幕,送礼。还会跟主播进行互动,除了互动以外,还有一对一、多对一的连麦等深度用户行为。除了这些用户行为,还需考虑时间因子,因为兴趣会随时间波动,产生短期兴趣和长期兴趣。
3)冷启动处理。一般平台会通过用户初始选择标签的方式进行冷启动推荐,但很多时候,用户对于标签的选择是敷衍了事的态度。所以过于依赖新标签,冷启动准确率不会那么高,而达观会在底层打通用户数据,获得用户在不同平台上的关系属性、购买属性和社交属性。最重要的是一旦用户在做了一个点击动作,达观可以毫秒级更新用户画像,快速更新模型。达观数据融合了多种算法,在数据的架构和处理上做了一个离线、在线和近线三级架构,能够保证整个系统的稳定性和灵敏度。
此外,在技术上,达观数据跟任何的客户都是后端对接的,具体调用的接口展示在哪个应用场景,由客户自主决定。一般直播客户会在三个不同的场景使用达观的推荐接口。
第一个是APP首页的猜你喜欢。类似今日头条,整个首页的信息流都是个性化推荐;第二个是直播平台上“我的附近”,主动寻求个性化推荐。第三个是在搜索的页面调用达观的个性化推荐接口。
总体而言,个性化推荐的应用可以帮助企业在各个应用场景下精准运营,实时把握客户需求,提高用户付费转化。
申请试用达观产品:https://data.datagrand.com/signup/#/experience?source=online
关注“达观数据”公众号,获取更多干货知识。