第五篇:一个陌生人社交产品的数据分析

一、构建一个监控产品健康度的漏斗

第一步:选取关键事件

我认为有两种思路选取关键事件。

方法一:通过思考产品的核心价值,推断出用户的行为路径。

先画出这个产品的主要流程:

这个陌生人社交产品的核心价值是:通过匹配让陌生用户之间建立联系。因此上述流程中,最核心的体验是:是否喜欢→匹配成功→聊天,关键事件包括:选择喜欢匹配成功→发送消息→收到消息

方法二:通过【用户路径】的数据结果,挑选出关键事件。

第二步:使用间隔分析,设置合理的窗口期时长

为了排除极端数值对结果的影响,这里可以选取【人均间隔时间的中位数】,大约是6.7天,取整数后为7天,因此窗口期设置为7天较为合理。

第三步:创建漏斗,查看核心流程关键环节指标以及转化率

选择【漏斗分析】→【创建漏斗】→选择事件【选择喜欢】、【匹配成功】、【发送消息】、【收到消息】→窗口期选择【7天】

第四步:监控核心体验健康度

想要提升核心体验转化率,可以分别去思考每一步转化率的提升。

第一、从【选择喜欢】到【匹配成功】,存在这几个步骤:

如果用户每天能喜欢的人有数量上限,那么可以在用户A喜欢用户B之后,将用户B优先推荐给用户A,从而提前获得匹配结果;

可以根据用户的喜欢历史,猜测用户喜好,提供更符合用户喜好的推荐;

第一, 从【匹配成功】到【发送消息】,这一步的转化率已经接近90%,因此是比较理想的数据;

第二, 从【发送消息】到【收到消息】,这里发送消息的定义是“前端点击发送按钮”,因此有可能出现3种结果:一是用户A将消息发送给用户B,用户B成功收到了;二是用户A将消息发送给用户B,但是用户B没有收到;三是用户A没有成功发送消息。后两种结果,可能是用户的网络有问题,也有可能是产品服务器有问题,如果是用户网络问题,当用户使用了风险较高的网络时(如2G),给予提示“您目前使用的网络可能导致消息发送失败,建议您更换网络后再进行操作”;如果是产品服务器的问题,就要定位并解决服务器问题。

二、分析不同属性用户的产品体验情况

这一部分采取多维度拆解的方法进行分析。

维度一:性别(男、女)

可以看出,女性用户的总转化率几乎是男性用户的2倍,女性用户从【选择喜欢】到【匹配成功】的转化率差不多高出20%,【发送消息】到【收到消息】的转化率也差不多高出20%。有可能是因为:

① 这个产品的男女比例在2:1,女性用户被喜欢的基数更大,以致于匹配成功的概率更高。女性用户如果主动发送消息,被回复的概率也更高;

②男性用户选择喜欢相对更加大胆,而女性用户更加谨慎;

③女性用户更有可能精心处理照片,使照片质量更高,更容易获得异性的喜欢。而男性用户一般不太会拍照,而且不会在照片处理上花太多心思,因此被喜欢的概率就要低一些;

④ 俗话说,“女追男隔层纱”,所以女性用户给男性用户发送消息更有可能收到回复;

维度二:年龄

经对比,转化率随着用户年龄的不同并没有呈现出很大差异,年轻群体和中年群体数据区别不大。

]维度三:位置(省份、城市)

经对比,转化率随着用户省份的不同并没有呈现很大差异,基本上在总体转化率±3%左右,经济发达省份和落后省份区别不大。

除了青海省的转化率较低(比总体低接近10%),考虑到青海省的样本量较小,不太具有代表性,因此暂时不做深究。

从城市来看,一线、二线、三线…等城市的转化率区别不大。另外由于城市的样本量较小,因此暂时不做深究。

综上所述,核心体验的效果会因为用户性别不同而有较大的区别,女性用户的体验优于男性用户的体验。而不同年龄、不同省份城市的用户体验效果差异不大。

三、这个产品国庆期间出现了“数据猛涨”的现象,是什么原因导致的?

首先,对“数据猛涨”给出定义:

考虑到假期,用户新增可能会受影响,因此,选择观察【注册成功】的【触发用户数】。

【注册成功】的用户数相比国庆前一周环比增长了15.86%,对比平常的周环比增长率要高出2倍。

对异常数据进行多维度拆解分析

接下来将选取常见的维度进行分析:用户属性(性别、年龄、省份城市)、事件属性(操作系统、注册方式)

维度一:性别

男生和女生国庆期间的数据都有一定程度的涨幅,因此性别不是导致国庆期间数据猛涨的原因。

维度二:年龄

不同年龄的用户国庆期间的数据都有一定程度的涨幅且趋势相似,因此年龄不是导致国庆期间数据猛涨的原因。

维度三:省份城市

可以明显看出海南、云南这两个地方的增长特别夸张。

由于基数不同,其他省份的情况不太容易看出变化情况,所以把数据导出来进行进一步观察:

除了海南(+540.71%)和云南(+73.48%),重庆(+18.77%)、北京(+15.65%)和广东(+8.77%)的增长数量和增长率也比较突出。广西、吉林、湖南和四川等省份虽然增长率较高,但本身基数小;上海增长数量较多,但本身基数大,所以这些地方的增长可以视为假期正常增长范围,就不另作研究了。

接下来观察海南、云南、重庆、北京、广东的城市数据

三亚、大理、丽江、重庆和北京这几个城市给国庆期间带来了大量新增注册用户,考虑到这几个都是比较热门的旅游城市,为用户“交友”提供了更合适的场景,因此导致大批用户下载并使用。也有可能这几个城市有线下推广活动,后续可以跟运营、市场、渠道确认。

维度四:操作系统

由于基数不同,从折线图比较难看出苹果的数据变化情况。因此将安卓和苹果【注册成功用户数】导出来,经过计算:

不同操作系统的数据都有增长,因此本次数据猛涨跟操作系统没有关系。

维度五:注册方式

不同注册方式的数据都有一定程度的增长,因此本次数据增长跟注册方式无关。

四、找到另外一个数据异常的时间节点,分析原因。

从下图可以看出,9月14日的数据呈现断崖式下跌,并且情况很严重

根据经验,一般出现断崖式下跌,技术问题的可能性比较大,因此先进行这一假设的验证。

首先进行小时级别的拆分:

我们发现,从9月14日19:00开始,数据比上周同期要低很多。一直到24:00才恢复到上周趋势。

在此基础上,增加用户属性和事件属性进行多维度分析。

【性别】,可以看出【男性】用户数据异常,而【女性】用户数据跟平时趋势一致

【年龄】,不同年龄的数据异常情况跟总体保持一致,因此排除

【省份】【城市】,不同省份、城市的数据异常情况跟总体保持一致,因此排除

【操作系统】,不同操作系统数据异常情况跟总体保持一致,因此排除

【注册方式】,不同注册方式的数据异常情况跟总体保持一致,因此排除

【设备】,不同设备的数据异常情况跟总体保持一致,因此排除

综上所述,可以确认在9月14日大约19:00开始,该产品出现技术故障,导致所有【男性】用户使用异常。而由于晚上【20:00-24:00】是这个产品的用户同时在线的高峰期,并且【男性】用户比例高于60%,最终导致这次严重的数据异常。

五、找出具有怎样特征的用户在这个产品中更受欢迎。

首先定义“受欢迎”:被“喜欢”的次数越多,该用户越受欢迎

选择这个指标来衡量受欢迎程度,不选其他指标的原因是:

①   人物卡片曝光次数:

考虑到这种情况:当用户A被推荐给其他用户,其他用户可能只是觉得“还行”,需要二次确认是否喜欢,于是点开查看用户A的卡片,这样用户A的卡片曝光次数会增加。但是看了之后别人可能不喜欢用户A,这样用户A被“不喜欢”的次数就增加了,因此不使用这个指标。

②   被“不喜欢”的次数:

当用户看到推荐的人的时候,可以选择“喜欢”或者“不喜欢”,因此被“喜欢”的次数越多跟被“不喜欢”的次数越少实际上是一回事,而被“喜欢”的次数会更加直观,所以就不选这个指标了。

③   匹配成功的次数:

考虑到这种极端情况:用户B对所有推荐的用户都“喜欢”(因为题目没有提到该产品单用户是否存在喜欢上限),那么对用户B来说,匹配成功的概率就变成单方面的对方是否喜欢ta的概率了。从统计学的角度,两个独立事件同时发生的概率是两个事件概率的乘积,并且乘积都小于两个事件单独的概率,在刚刚提到的情况中,用户B这边的概率变成了1,所以ta匹配成功的概率会比其他用户都高,但ta不见得就是受欢迎的。

④   收到消息的数量:

这个跟匹配成功有点类似,当一个用户通过极端操作有很高的匹配成功次数,ta就可以发出很多消息,这样就更有可能收到很多回复,因此不选用这个指标。

对被“喜欢”的次数这个指标进行多维度分析

通过【事件分析】【选择喜欢】的【总次数】,按照【对象性别】、【对象年龄】、【距离】和【照片数量】观察

【对象性别】

【女性】用户被喜欢的次数占比超过了50%,因此女性用户比男性用户更受欢迎

【对象年龄】

总体上看,更容易被喜欢的年龄是:25、26、24、27、28、23,也就是23-28岁

不同性别的情况跟总体情况类似,在【23~28岁】这个年龄段更容易被喜欢

另外可以发现,年龄越大,越难被喜欢,毕竟到30岁左右,大部分人都已经成家了,还没成家的一般也不会通过这类型的产品来“找对象”,走线下相亲的会更多。这个产品不太适合年纪比较大的用户。

【照片数量】

总体上看,照片数量在5张、4张、3张、6张的时候,更容易被喜欢。

不同性别的情况跟总体情况类似,照片数量为【3~6张】时更容易被喜欢

一个有趣的现象是,照片数量超过7张以后,被喜欢的次数会骤降,可能是因为看的照片越多,越觉得没有“神秘感”了。

【距离】

总体上看,距离在400至500、500至600、300至400、600至700时,更容易被喜欢

不同性别的情况跟总体情况类似,用户距离为【300~700米】时更容易被喜欢。另外,从表格数据可以看出,距离太近或太远,特别是距离太远时就很难受欢迎。

综上所述,在这个产品中更受欢迎的用户有以下共同特征:

女性,23~28岁,照片数量为3~6张,距离为300~700

六、找出可能认为产品体验更好的用户群体。

首先定义“体验好”:能让用户的社交需求得到满足:匹配到喜欢的对象,然后聊天。

因此选择“选择喜欢→匹配成功”(下面简称“匹配率”)和“发送消息→收到消息”(下面简称“消息到达率”)作为分析的指标,“匹配率”和“消息到达率”越高,用户的体验越好。

对【匹配率】和【消息到达率】进行多维度分析

选取不同的用户属性(性别,年龄,省份城市)进行对比

维度一:性别

无论【匹配率】还是【消息到达率】,女性用户都明显高于男性用户

维度二:年龄

年龄为28岁的用户【匹配率】和【消息到达率】最高

维度三:省份城市

广西的【匹配率】和【消息到达率】最高

承德市的【匹配率】和【消息到达率】最高

综上所述,28岁来自广西的女性或28岁来自承德市的女性的体验最好。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,923评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,154评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,775评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,960评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,976评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,972评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,893评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,709评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,159评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,400评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,552评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,265评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,876评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,528评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,701评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,552评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,451评论 2 352

推荐阅读更多精彩内容