使用Python完成《数据分析实战》中的案例-2

什么样的顾客会选择离开

现状与预期

现状: “和上月相比,本月的用户数减少了”。

预期 : 查清用户数减少的原因,并确保和上月相同的用户数。

发现问题

为明确现状与预期之间差距的结构,我们需要思考上月与本月有什么不同的地方。在发现问题阶段,重要的是从大而广的视角出发来考虑各种可能性。 尝试做出假设:

1. 商业推广上存在问题,流失的用户数超过了新增的用户数

2. 每月不同主题的游戏活动开始变得很无聊,用户都不爱玩了

3.  按用户的性别或者年龄段等属性来划分用户群,可能是其中某个用户群出现了问题

通过咨询市场部和游戏开发部,对上述假设进行大致的验证。

1.  同上月相比,商业推广的力度大体没变,新增用户数也大致保持在相同的水平

2. 开展的各种游戏活动同上月相比几乎没有变化

验证发现,第 1 条或第 2 条假设没有发现导致用户数减少的问题,因此可能是第3条假设,某个用户群体出现问题。—用户群通常是按照性 别、年龄段等来划分的。首先我们可以考虑是否有某个属性的用户群数量减少了,然后通过和上月的数据加以比较,确认用户数量减少了的用户属性,并思考如何恢复用户数量。

数据收集和加工

探讨所需要的数据

这里,我们只知道存在问题,但却还无法明确问题出现的原因。因此,需要通过数据分析来探索原因所在,这种方式称为“探索型数据分析”。

为了能够通过数据明确问题,我们需要下面的数据。

DAU(  Daily Active User,每天至少来访 1 次的用户数据)

user_info(用户属性数据)

查看报表内容及结构,检查是否存在数据缺失

dau 数据信息包含:访问时间(log_date)、应用名称(app_name)、用户ID(user_id)

user_info 数据信息包含:首次登陆时间(install_date)、应用名称(app_name)、用户ID(user_id)、性别(gender)、年龄段(generation)、设备类型(device_type)

数据加工

合并两个数据表

添加一列只显示年月的数据‘log_month’,方便后续月度数据对比。

数据分析

进行因果关系的分析时,具体来说有以下几步。

1. 用户群分析(对每个用户群进行交叉列表统计)

2. 将已明确的用户群数据可视化

对每个用户群进行交叉列表统计(用户群分析)

用户群分析(性别)

通过比较 2013 年 8月和 9 月男女用户的数量,可以看出两个用户群的数量都下降了,但各自的构成比例却大体上没有发生变化,所以性别这个属性对现在的问题影响不大。

用户群分析(按年龄段统计)

通过比较 2013 年 8 月和 9 月的数据,我们可以看到无论是哪个年龄段,在整体用户数量中所占的比例都没有发生大的变化,也没有发现哪个年龄段的用户数大量减少了。因此,再考虑进一步细分结果,观察是否某个性别,某年龄段用户减少。

用户群分析(性别×年龄段)

通过观察统计数据,我们发现各个用户群的用户数量整体都下降了,但每个用户群所占的比例大体没变,也没有发现哪个用户群的数量急剧下降。

用户群分析(设备)

下面我们需要考虑的是用户所使用的设备的差异。

结果是使用 iOS 设备的用户数略有下降,而使用 Android 的用户却大量减少了,因此这个用户群的分析很可能就是解决该问题的关键。

为了更详细地看到上述数值的差异,我们可以生成以天为单位的时间序列图,据此来确认用户数的变化程度。

将用户群分析结果可视化

为了确定每种设备用户数在时间序列上的变化情况,我们利用时间序列图将数据可视化,并得出了显而易见的结论。上图的横轴表示访问日期,纵轴表示访问次数,两条曲线分别表示 iOS 和 Android 设备的访问次数随时间的变化情况。

可以看出, iOS 的用户数和之前大体相同,而 Android 的用户数从9 月的第 2 周开始急剧减少。

根据分析的结果,和游戏开发部门确认后,得知 9 月 12 日 Android版应用进行了一次版本升级。导致部分旧机型用户无法正常登陆。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容