使用Python完成《数据分析实战》中的案例-3

A/B 测试 哪种广告的效果更好

现状与预期

促销活动的购买率低

通过和其他应用的促销活动相比较,我们发现《黑猫拼图》游戏的促销活动的购买率确实偏低。因此,我们希望能够通过数据分析找出购买率偏低的原因,改善这 种状况。

整理现状和预期

现状: 和其他应用的促销活动相比,《黑猫拼图》的游戏装备促销活动的购买率偏低。

预期: 弄清楚购买率偏低的原因,并确保和其他应用的促销活动有相同的购买率。

发现问题

和其他应用有何不同

为明确现状与预期之间的差距,我们需要从大的视角出发来考虑《黑猫拼图》游戏和其他应用有何不同,并尝试做出假设。

1. 游戏装备促销活动的内容有问题

    → 销售的游戏装备并不是用户需要的

    → 销打折的力度不够,对用户没有太大吸引力

2. 广告的外观展示有问题

通过咨询了游戏的策划部门,并统计了在促销期间出售的游戏装备的使用情况,得到了如下反馈。

游戏装备促销活动中出售的游戏装备或许能够用得上

和其他应用一样,促销时的游戏装备打五折,这从用户的立场来看是很划算的

也就是说,上述第 1 个假设中的问题基本不大。 通过咨询了市场营销部门,得到:

游戏装备大促销的广告都是由各个应用的设计师负责的,所以广告的质量也是参差不齐

《黑猫拼图》游戏的广告的点击率一直比较低(参考下表)

数据的收集和加工

探讨验证方法

问题

 →《黑猫拼图》游戏的广告点击率比其他应用低      (事实)

 →《黑猫拼图》游戏的广告设计有问题      (假设)

解决方案

 → 用点击率高的广告替换目前所使用的广告  (解决方案)

为了完成上述方案,需要找到哪种广告更容易被点击。但是,在《黑猫拼图》游戏中,之前每月开展的“游戏装备大促销”活动的广告一直都没有变更过,因此我们缺少可供分析的数据。

于是,我们准备了两个不同的广告,通过收集数据来比较哪个广告更容易被用户点击。

如果采用前后比较的方法,则无法排除外部因素的干扰

如下图所示,在前一段时间内投放广告A ,在后一段时间内投放广告B,并比较前后两个时间段广告投放的效果。其思路是“如果继续投放广告A,购买率应该是这样”,然后拿这个值和广告 B 的值进行比较。然而,这种做法却存在外部因素干扰。比如说:A广告投放时间结束后,改投放B广告,在此期间,购买率得到提升,是因为B广告奏效呢?还是A广告效应延迟的结果。这是难以证明的。

采用A/B测试的方法排除外部因素干扰

A/B 测试能够在多个选项中找出那个能够带来最佳结果的选项。例如,如下图所示,我们只要同时投放广告 A 和广告 B,就可以排除之前所说的外部因素的干扰。

A/B 测试虽然在引入时需要较高的开发成本,但是实施成本却相对较低,而且也方便收集统计数据,因而在互联网业界被广泛使用,此外在部分广告业和制造业中也会被采用。

● A/B测试中的用户分组必须遵循随机的原则

          要想避免条件性的差异,最简单的一种分组方法就是把用户 ID 对某个数进行取模运算。

● 同时进行多个A/B测试时的陷阱

        A/B 测试是将测试对象随机分为 A、 B 两组,然后比较两组之间差异的验证方法,但是有的企业会在同一时间开展多个 A/B 测试。在这种情 况下,就算这些 A/B 测试各自使用了上述方法来对用户进行分组,彼此之间仍有可能相互干扰。如:① 所有的 A/B 测试都采用相同的分组方法;② 各组中参与其他测试的用户比例不同。

利用统计学上的假设检验来过滤

不光是在 A/B 测试中,平时当我们需要判断两组之间是否存在差异时,都可以用到统计学上的“假设检验”。

众所周知,偶然的行为(异常值)在用户数较少的情况下,某一个用户的偶然行为都可能对结果造成较大的影响。但当用户数增多时,这种影响就会逐渐消失。因此,使用假设检验时,人数越多,越容易得出“存在显著性差异”的结论。然而,即使“存在显著性差异”,这种差异在商业领域也未必有意义。尤其是在大数据盛行的现在,由于数据量的增大,假设检验中“用户数较少导致的偏差”已经很小了,因此我们很难再断言“不做假设检验就不知道是否存在显著性差异”的那些差异还有意义。

尽管如此,万一出现了“看上去像是有差异,而实际上不是显著性差异”的情况还是很麻烦的, 因此我们需要通过假设检验来过滤出显著性差异。这里并不是说只要“通过假设检验找出差异”就可以了,而是要“先通过假设检验找出有统计意义的差异,再探讨这个差异在商业活动中是否有意义”。

收集和加工验证所需要的数据

A/B测试的日志输出

ab_test_imp(关于广告曝光次数的信息)

ab_test_goal(关于广告点击次数的信息)

查看数据结构并检查是否存在缺失值

分析前的数据加工

  ● 广告的曝光次数信息和点击次数信息合并起来

  ● 生成一个新的标志位来标识该条记录是否被点击

数据分析

弄清楚 A 和 B 的点击率是否存在显著性差异

统计一下A和B两个广告的点击率,以确定哪个广告的效果更好。

观察 A 和 B 的点击率,我们发现 A 的点击率为 0.08026,大约是8%,而 B 的点击率为 0.11546,大约是 12%。在探讨这二者的差异之前,首先需要对其进行假设检验。像本例这样,针对两种广告点击情况的差异来进行假设检验,一般采用的是卡方检验。

在本例中,计算出来的结果,卡方值308.38,P值4.93e-69,自由度1;由于 p 值非常接近于 0,因此我们可以说:在将两种广告分为 A 和 B 并同时投放后,所得到的点击率存在显著性差异。

广告 A 和 B 的点击率的时间序列变化的可视化

在确认了二者“存在显著性差异”后,我们再来看这种差异在商业领域里是否有意义。在本例中,原来广告的点击率只有 6%,而其他应用的广告的点击率为12%。为了填补这个差异,我们进行了测试。通过观察结果可以发现广告 B 的点击率达到了大约 12%,基本上达到了我们的目的,因此在商业领域里这也是一个有意义的差异。最后,我们再确认一下点击率的时间序列变化情况。在时间序列图中,如果广告 B 的效果始终都比广告 A 好的话,那就没有问题,但是如果只是在某个时间段内广告 B 的效果更好,那就需要考虑是否存在别的原因了。

通过上图可知,广告 B 的点击率在大多数时候都优于广告 A。所以总的说来,广告 B 的效果始终都比广告 A 好。

解决对策

分析的结果是,广告 B 比广告 A 更容易被用户点击,因此我们需要在《黑猫拼图》游戏里投放广告 B。今后,我们可以继续通过这种 A/B测试的方式来找到最合适的广告。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,826评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,968评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,234评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,562评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,611评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,482评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,271评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,166评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,608评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,814评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,926评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,644评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,249评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,866评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,991评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,063评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,871评论 2 354

推荐阅读更多精彩内容

  • 从事移动广告商业变现多年,总是觉得产品与商务的同事是一对“欢喜冤家”。站在开发者的角度,关注用户体验最优是无可厚非...
    游社长阅读 8,647评论 2 78
  • 每天进步一点点点点点点点点点点点点点点点点点点点点点点点点点点点点点点~~从开始只能写几句话、模仿别人的观点,到现...
    一个帅气的名字呀阅读 18,091评论 4 31
  • 文|火山 “感觉自己不会再爱了,愿下辈子一个人一辈子”这是我今天在朋友圈看到的一句话。而发这句话的人是我一个多年要...
    火山House阅读 248评论 0 5
  • 左和右 (一) 那是一个深秋,绿意未尽的树叶在微风中翩翩起舞,散落了满地金黄。每当踏上这条窄窄的青...
    邓噔噔噔阅读 206评论 0 0
  • 老公是去吃饭见到排队扭头就走的人,用他的话来说就是“吃啥也行,简单点、吃饱就行”,而我是为了吃个顺口的小吃,可以意...
    丰盛小五阅读 264评论 0 1