前段时间天知乎社区用户@吴清源的一篇文章火了,还没看过文章的可以在知乎搜索《我收到了Angelababy的投诉,很抱歉,是我们降低了杨颖小姐的社会评价》,杨颖小姐作为流量明星的代表,一边靠流量为生、一边却偏偏想以演技好自居。
我为什么要提到这篇文章呢?这篇文章截至我开始写文章前已经获得了13.9万以上的赞同、2.8k的赞赏人数、1万多评论,这是什么概念呢?知乎社区目前最高赞的回答赞同数量只有14万赞。
这样的数据触目惊心,转回一想似乎又有道理又无道理,有道理在现在全宇宙都在抨击这种流量明星所以有这么好的抨击文章像是星星之火;没道理在,既然大家都讨厌流量明星,那么谁在为流量明星买单?
我们以流量明星Angelababy为例。
1、百度指数(注意从百度指数看的人群是习惯使用百度人人群,所以该指标下的所有统计都是基于百度用户的画像)
从百度搜索指数人群年龄以及性别上看:习惯使用百度人人群中为Angelababy流量买单的人主要是30~39岁的人,占到整体人群年龄段的60%左右;性别方面,为Angelababy流量买单的主要是女性同样以60%多的比例高于男性
从地域上看,出乎意料为Angelababy流量买单人数最多省份竟然是浙江,而最多人数的城市是Angelababy的出生地:上海
关心流量明星Angelababy的人都在关心她的什么呢?从关键词需求图谱,我们发现关注Angelababy的大部分关注的是:他的老公黄晓明、孩子、赵丽颖(大家好像很愿意拿她们俩做对比)、演技一样差的唐嫣、整容事件。
2、微博评论(注意从微博评论看的人群是习惯使用微博的人群,所以该指标下的所有统计都是基于新浪微博用户的画像)
我选取了Angelababy的一条相对比较显著的微博,共计有20377条转发,用Python爬虫把转发人的的基本信息都抓取下来。
整个微博的转发路径为,最高层为第六层(下图数据来自北京大学 PKUVIS 微博可视分析工具):
女性比例为59.4%几本与百度指数基本吻合,而在省份比例中我们会惊讶地发现在微博上给Angelababy带来流量最大的竟然是:广东、江苏、北京三个地区。
同时,新浪微博的用户相对偏年轻,我们看一下新浪微博用户中的Angelababy的粉丝的年龄层分布,从图中我们会发现Angelababy的新浪微博粉丝年龄大部分集中在12~28岁,并且是随着年龄的减小,粉丝数量递增,在12岁达到最高。
另外,在上面做统计的时候,我需要删除一些单个用户多次评论的情况以确保统计结果的正确性,在去重复的过程中我有一个比较惊奇地发现:
Angelababy的粉丝真的那么多吗?我们看看在这些评论中疑似水军、或者一些脑残粉即疯狂刷屏的人有多少,这样我们才能了解到真实数据。
从单用户转发次数我们提取单一用户转发次数超过100次的用户,如下图所示,其中甚至用户名为青涩鼻鼻,用户id为5729949390的用户转发单条微博超过591次,此条微博的总共转发次数为20000多次。
而在转发时候的评论内容,内容重复次数超过90的如下,其中转发只附有一个表情的就有924次。
如果对重复多次的内容,对这些数据刷子新浪微博用户进行删除去重、重复多次的id进行删除,我们得到的真实数据是:7002条转发,占总转发的35.3%,超过百分之五十的都是无意义的重复内容或者单人重复评论。
所以,Angelababy的粉丝也不是新浪微博那些数据看上去的那么可怕,不过是脑残粉太多,如果少了一些脑残粉,世界会清静了很多吧。