一、构建一个监控产品健康度的漏斗
第一步:选取关键事件
我认为有两种思路选取关键事件。
方法一:通过思考产品的核心价值,推断出用户的行为路径。
先画出这个产品的主要流程:
这个陌生人社交产品的核心价值是:通过匹配让陌生用户之间建立联系。因此上述流程中,最核心的体验是:是否喜欢→匹配成功→聊天,关键事件包括:选择喜欢→匹配成功→发送消息→收到消息
方法二:通过【用户路径】的数据结果,挑选出关键事件。
第二步:使用间隔分析,设置合理的窗口期时长
为了排除极端数值对结果的影响,这里可以选取【人均间隔时间的中位数】,大约是6.7天,取整数后为7天,因此窗口期设置为7天较为合理。
第三步:创建漏斗,查看核心流程关键环节指标以及转化率
选择【漏斗分析】→【创建漏斗】→选择事件【选择喜欢】、【匹配成功】、【发送消息】、【收到消息】→窗口期选择【7天】
第四步:监控核心体验健康度
想要提升核心体验转化率,可以分别去思考每一步转化率的提升。
第一、从【选择喜欢】到【匹配成功】,存在这几个步骤:
如果用户每天能喜欢的人有数量上限,那么可以在用户A喜欢用户B之后,将用户B优先推荐给用户A,从而提前获得匹配结果;
可以根据用户的喜欢历史,猜测用户喜好,提供更符合用户喜好的推荐;
第一, 从【匹配成功】到【发送消息】,这一步的转化率已经接近90%,因此是比较理想的数据;
第二, 从【发送消息】到【收到消息】,这里发送消息的定义是“前端点击发送按钮”,因此有可能出现3种结果:一是用户A将消息发送给用户B,用户B成功收到了;二是用户A将消息发送给用户B,但是用户B没有收到;三是用户A没有成功发送消息。后两种结果,可能是用户的网络有问题,也有可能是产品服务器有问题,如果是用户网络问题,当用户使用了风险较高的网络时(如2G),给予提示“您目前使用的网络可能导致消息发送失败,建议您更换网络后再进行操作”;如果是产品服务器的问题,就要定位并解决服务器问题。
二、分析不同属性用户的产品体验情况
这一部分采取多维度拆解的方法进行分析。
维度一:性别(男、女)
可以看出,女性用户的总转化率几乎是男性用户的2倍,女性用户从【选择喜欢】到【匹配成功】的转化率差不多高出20%,【发送消息】到【收到消息】的转化率也差不多高出20%。有可能是因为:
① 这个产品的男女比例在2:1,女性用户被喜欢的基数更大,以致于匹配成功的概率更高。女性用户如果主动发送消息,被回复的概率也更高;
②男性用户选择喜欢相对更加大胆,而女性用户更加谨慎;
③女性用户更有可能精心处理照片,使照片质量更高,更容易获得异性的喜欢。而男性用户一般不太会拍照,而且不会在照片处理上花太多心思,因此被喜欢的概率就要低一些;
④ 俗话说,“女追男隔层纱”,所以女性用户给男性用户发送消息更有可能收到回复;
维度二:年龄
经对比,转化率随着用户年龄的不同并没有呈现出很大差异,年轻群体和中年群体数据区别不大。
]维度三:位置(省份、城市)
经对比,转化率随着用户省份的不同并没有呈现很大差异,基本上在总体转化率±3%左右,经济发达省份和落后省份区别不大。
除了青海省的转化率较低(比总体低接近10%),考虑到青海省的样本量较小,不太具有代表性,因此暂时不做深究。
从城市来看,一线、二线、三线…等城市的转化率区别不大。另外由于城市的样本量较小,因此暂时不做深究。
综上所述,核心体验的效果会因为用户性别不同而有较大的区别,女性用户的体验优于男性用户的体验。而不同年龄、不同省份城市的用户体验效果差异不大。
三、这个产品国庆期间出现了“数据猛涨”的现象,是什么原因导致的?
首先,对“数据猛涨”给出定义:
考虑到假期,用户新增可能会受影响,因此,选择观察【注册成功】的【触发用户数】。
【注册成功】的用户数相比国庆前一周环比增长了15.86%,对比平常的周环比增长率要高出2倍。
对异常数据进行多维度拆解分析
接下来将选取常见的维度进行分析:用户属性(性别、年龄、省份城市)、事件属性(操作系统、注册方式)
维度一:性别
男生和女生国庆期间的数据都有一定程度的涨幅,因此性别不是导致国庆期间数据猛涨的原因。
维度二:年龄
不同年龄的用户国庆期间的数据都有一定程度的涨幅且趋势相似,因此年龄不是导致国庆期间数据猛涨的原因。
维度三:省份城市
可以明显看出海南、云南这两个地方的增长特别夸张。
由于基数不同,其他省份的情况不太容易看出变化情况,所以把数据导出来进行进一步观察:
除了海南(+540.71%)和云南(+73.48%),重庆(+18.77%)、北京(+15.65%)和广东(+8.77%)的增长数量和增长率也比较突出。广西、吉林、湖南和四川等省份虽然增长率较高,但本身基数小;上海增长数量较多,但本身基数大,所以这些地方的增长可以视为假期正常增长范围,就不另作研究了。
接下来观察海南、云南、重庆、北京、广东的城市数据
三亚、大理、丽江、重庆和北京这几个城市给国庆期间带来了大量新增注册用户,考虑到这几个都是比较热门的旅游城市,为用户“交友”提供了更合适的场景,因此导致大批用户下载并使用。也有可能这几个城市有线下推广活动,后续可以跟运营、市场、渠道确认。
维度四:操作系统
由于基数不同,从折线图比较难看出苹果的数据变化情况。因此将安卓和苹果【注册成功用户数】导出来,经过计算:
不同操作系统的数据都有增长,因此本次数据猛涨跟操作系统没有关系。
维度五:注册方式
不同注册方式的数据都有一定程度的增长,因此本次数据增长跟注册方式无关。
四、找到另外一个数据异常的时间节点,分析原因。
从下图可以看出,9月14日的数据呈现断崖式下跌,并且情况很严重
根据经验,一般出现断崖式下跌,技术问题的可能性比较大,因此先进行这一假设的验证。
首先进行小时级别的拆分:
我们发现,从9月14日19:00开始,数据比上周同期要低很多。一直到24:00才恢复到上周趋势。
在此基础上,增加用户属性和事件属性进行多维度分析。
【性别】,可以看出【男性】用户数据异常,而【女性】用户数据跟平时趋势一致
【年龄】,不同年龄的数据异常情况跟总体保持一致,因此排除
【省份】【城市】,不同省份、城市的数据异常情况跟总体保持一致,因此排除
【操作系统】,不同操作系统数据异常情况跟总体保持一致,因此排除
【注册方式】,不同注册方式的数据异常情况跟总体保持一致,因此排除
【设备】,不同设备的数据异常情况跟总体保持一致,因此排除
综上所述,可以确认在9月14日大约19:00开始,该产品出现技术故障,导致所有【男性】用户使用异常。而由于晚上【20:00-24:00】是这个产品的用户同时在线的高峰期,并且【男性】用户比例高于60%,最终导致这次严重的数据异常。
五、找出具有怎样特征的用户在这个产品中更受欢迎。
首先定义“受欢迎”:被“喜欢”的次数越多,该用户越受欢迎
选择这个指标来衡量受欢迎程度,不选其他指标的原因是:
① 人物卡片曝光次数:
考虑到这种情况:当用户A被推荐给其他用户,其他用户可能只是觉得“还行”,需要二次确认是否喜欢,于是点开查看用户A的卡片,这样用户A的卡片曝光次数会增加。但是看了之后别人可能不喜欢用户A,这样用户A被“不喜欢”的次数就增加了,因此不使用这个指标。
② 被“不喜欢”的次数:
当用户看到推荐的人的时候,可以选择“喜欢”或者“不喜欢”,因此被“喜欢”的次数越多跟被“不喜欢”的次数越少实际上是一回事,而被“喜欢”的次数会更加直观,所以就不选这个指标了。
③ 匹配成功的次数:
考虑到这种极端情况:用户B对所有推荐的用户都“喜欢”(因为题目没有提到该产品单用户是否存在喜欢上限),那么对用户B来说,匹配成功的概率就变成单方面的对方是否喜欢ta的概率了。从统计学的角度,两个独立事件同时发生的概率是两个事件概率的乘积,并且乘积都小于两个事件单独的概率,在刚刚提到的情况中,用户B这边的概率变成了1,所以ta匹配成功的概率会比其他用户都高,但ta不见得就是受欢迎的。
④ 收到消息的数量:
这个跟匹配成功有点类似,当一个用户通过极端操作有很高的匹配成功次数,ta就可以发出很多消息,这样就更有可能收到很多回复,因此不选用这个指标。
对被“喜欢”的次数这个指标进行多维度分析
通过【事件分析】【选择喜欢】的【总次数】,按照【对象性别】、【对象年龄】、【距离】和【照片数量】观察
【对象性别】
【女性】用户被喜欢的次数占比超过了50%,因此女性用户比男性用户更受欢迎
【对象年龄】
总体上看,更容易被喜欢的年龄是:25、26、24、27、28、23,也就是23-28岁
不同性别的情况跟总体情况类似,在【23~28岁】这个年龄段更容易被喜欢
另外可以发现,年龄越大,越难被喜欢,毕竟到30岁左右,大部分人都已经成家了,还没成家的一般也不会通过这类型的产品来“找对象”,走线下相亲的会更多。这个产品不太适合年纪比较大的用户。
【照片数量】
总体上看,照片数量在5张、4张、3张、6张的时候,更容易被喜欢。
不同性别的情况跟总体情况类似,照片数量为【3~6张】时更容易被喜欢。
一个有趣的现象是,照片数量超过7张以后,被喜欢的次数会骤降,可能是因为看的照片越多,越觉得没有“神秘感”了。
【距离】
总体上看,距离在400至500、500至600、300至400、600至700时,更容易被喜欢
不同性别的情况跟总体情况类似,用户距离为【300~700米】时更容易被喜欢。另外,从表格数据可以看出,距离太近或太远,特别是距离太远时就很难受欢迎。
综上所述,在这个产品中更受欢迎的用户有以下共同特征:
女性,23~28岁,照片数量为3~6张,距离为300~700米
六、找出可能认为产品体验更好的用户群体。
首先定义“体验好”:能让用户的社交需求得到满足:匹配到喜欢的对象,然后聊天。
因此选择“选择喜欢→匹配成功”(下面简称“匹配率”)和“发送消息→收到消息”(下面简称“消息到达率”)作为分析的指标,“匹配率”和“消息到达率”越高,用户的体验越好。
对【匹配率】和【消息到达率】进行多维度分析
选取不同的用户属性(性别,年龄,省份城市)进行对比
维度一:性别
无论【匹配率】还是【消息到达率】,女性用户都明显高于男性用户
维度二:年龄
年龄为28岁的用户【匹配率】和【消息到达率】最高
维度三:省份城市
广西的【匹配率】和【消息到达率】最高
承德市的【匹配率】和【消息到达率】最高
综上所述,28岁来自广西的女性或28岁来自承德市的女性的体验最好。