【回复的内容】
可能万sir讲述的案例的背景与自己面对的案例的不同,觉得有些结论不是那么的适用,这里罗列,探讨一下
###不太认同, "很难通过数据分析找到人的个性人需求这一观点下面的支撑案例,用户的点击行为常常不能表现你的个性,网站获得最大量点击的算法,往往是加入色情内容的链接。" ###
原因如下:
一:往往满足生理层的需求能带来不错的点击量,用色情来引流,很容易就达到很高的用户活跃度,但是不同的人在马斯洛需求模型中占支配地位是的层级是不同的。如果色情能带来那么大的经济利益,那Netflix就应该全部提供色情电影,而不用别的分类了。况且色情电影也有很多不同的风格与口味嘛.
二:很多做数据分析的同事觉得很难从数据分析有点囧的原因是,在推荐系统这个行业,60分相对容易做,因为只要把相关的热点内容推给你的活跃用户,基本上就可以做到一个及格的活跃度,如果有进一步的要求,那就是像文章说的,用户A与B有相同的爱好,那么A喜欢的,B应该也喜欢。所以把A喜欢的推给B,这个叫协同过虑。做了这一步,只要这个平台的用户画像不是太离谱,那基本也可以做到80分,自己认为的推荐系统的目标,那就是从千人一面,做到千人百面,甚至千人千面,这就不好搞了
####不太认同, Netflix已经不用推荐算法了,然后推导出精准推荐没有商业价值####
原因如下:
一:一个好的平台,让用户喜欢,有很多个维度来做,一个是能创造出优秀的内容,第二个是能筛选出优秀的内容推荐给特定的用户。 Netflix的纸牌屋是创造了优秀的内容。现在国内的内容推荐相关的公司,为了自己平台的活跃,都有大量的费用花在购买内容,或是自建团队创造内容上。正如上面所说,算法推荐的千人千面,能在内容成本越来越高的情况下发掘出一些长尾内容推荐组用户,吸引用户,且把他们留在平台上或是产生付费
二:因为就自己了解到的,搞推荐的,一般有三大块(内容特征,用户特征,算法),算法是公开的,你问中同行他用了什么算法,他们会很乐意的分享,但是你问到他们的用户特征,画像,内容特征,划分策略,对不起,这个是商业机密。 而且就如文中所说的,把a喜欢的推给和他有相同爱好的,协同过虑算法,要找到和你兴趣相投的人,把他喜欢的文章,推荐给你,这就可以发挥巨大的价值,这个兴趣相同的人的特征分析是推荐系统的很基础的能力
所以:不搞推荐算法,并不能说推荐系统就不用搞了
自己的一点别的感慨:
关于数据分析师的窘境
一:分析难.
例如,音乐的推荐,用户点击了不喜欢,代表什么呢?有可能音乐与当前的氛围不搭, 现是比如晚上了,不想听这么激烈的曲子,不过以后你可以给我推荐. 又或者代表不喜欢这个风格的曲子, 但是这个歌手的曲子还是可以给我推荐的. 比如文章推荐,用户点了不喜欢,那有可能是用户看过了,不想再看.又或者是觉得这个文章标题党了 .特别是对于新闻类的文章来说,内容更新太快,一周的时间这个新闻就会过时,对这个新闻做的标注就像是耗材,过期了没啥用了
二: 度量数据分析师的产出难
正如文章里说明的,数据最擅长告诉我们过去的规律。而我们目前的机器学习相关的算法,只能挖掘出“相关性”。但是人们理解世界的方式是“因果” .数据分析师,其实20%时间看数据,80%时间找原因.再说,推荐平台首先依赖的是优质内容,然后再是算法,而且大家都觉得搞算法比较高大上,但是这些算法很多都是公开的,再然后是内容特征与用户画像的优化,好不容易找到一个自己认为有效的策略,然后去实现,验证,提升度有可能是微乎其微。甚至可能你这个策略一发布,用户活跃度指标还下降了
不过,以上的窘境,做为数据分析师的你,不妨换个思路:你把数据分析换成商业分析,是否就有一下就站在食物链顶端的感觉了
~~~~~~~~~~~~~~~~~~~~~~~~~~~
附上,万维纲老师分享的内容