[TOCE] 18 P2-C5-S1 速度很重要

Trustworthy Online Controlled Experiments Part 2 Chap 5


第二部分 为所有人准备的主题

第二部分的会深入讨论五个主题,这些主题对于与实验相关工作的人来说,都值得一读, 尤其是领导层。

我们从速度问题开始:端到端案例研究开始,该示例使用仔细的实验设计和分析来展示延迟和站点速度的重要性,以此作为对用户参与度和收入的敏感的替代指标。对于可能跨站点,或者跨域的的分析,这也是一个很好的例子。

接下来,由于指标对于每个公司的数据决策都是至关重要的,因此我们引入了组织指标,无论领导者是否参与实验,领导者都应该理解,讨论和建立针对其组织的指标。我们讨论了这些指标的需求,以及如何创建,验证和迭代这些指标。

尤其是随着组织不断发展其实验实践,领导者需要就实验指标和总体评估标准(OEC)进行讨论,并在理论上达成共识。 OEC组合了一个或多个满足实验所需特定标准的组织指标。该组合用于对这些指标之间的折衷进行编码,从而使在线控制实验和大规模推动创新变得更加容易。

随着组织开始在“Run”和“Fly”成熟阶段进行规模试验(请参阅第4章),建立机构记忆和元分析变得越来越有用。机构记忆捕捉过去的实验和变化,并推动创新,以帮助鼓励以数据为依据的决策文化,并促进持续学习。

最后,在线控制实验是在真实的人身上进行的,因此控制实验中的道德规范和对最终用户的考虑非常重要。我们强调了道德对于在线控制实验的重要性,总结了一些的重要考虑因素,并指出了该领域的其他资源。

第五章 速度问题

  • 网站反应慢的害处:沮丧的用户,负面的品牌认知度,增加的运营支出以及收入损失 − Steve Souders (2009)
  • 工程师将服务器性能提高10毫秒(这是我们眨眼的速度的1/30)带来的收益,比雇佣一个全职工程师花费的薪水要高的多。每毫秒都很重要
    − Kohavi, Deng, Frasca, Walker, Xu and Pohlmann (2013)
  • 提高速度,是我最爱的功能
    − Google shirt circa 2009

为什么要关心速度?

我们从一个端到端例子开始,来评估速度的重要性。许多例子都集中在用户界面(UI)上,因为它很容易展示,但是服务器端也有许多突破,而且很多公司的发现,速度至关重要!当然,越快越好,但是将性能提高十分之一秒有多重要?你应该雇佣一个专注性能表现的人吗?也许一个五人的团队?为了回答这些问题,我们可以通过运行简单的减速实验来量化此类工作的投资回报率(ROI)。 2017年,Bing 的第二个十分之一(秒)的改进, 为公司每年增加了1800万美元的年收入,足以资助一支庞大的团队。根据这些结果,以及多年来在多家公司中进行的尝试,我建议将延迟用作此类实验的指标。

在亚马逊,一个100毫秒的减速实验使销售量减少了1%(Linden 2006,10)。 Bing和Google的发言人进行了一次罕见的联合演讲(Schurman和Brutlag,2009年),显示了性能对关键指标的重大影响,这些指标包括不同的查询,收入,点击次数,满意度和点击时间。 Bing于2012年进行的一项详细研究(Kohavi等人,2013年)显示,每100毫秒的提速可将收入提高0.6%。在2015年,随着Bing的性能提高,当95%的访问可以在百分之一秒内返回结果时,人们对继续提升服务器性能的价值产生了质疑。后续研究表明,虽然对收入的影响有所减少(比例),但由于Bing的收入增长了很多,以至于提高性能的每一毫秒都比过去更有价值:每提高4毫秒就为一名工程师提供了一年的薪水!

在《Why Performance Matters》(Wagner 2019)中展示了多个与绩效相关的结果,显示了转换率和用户参与度的改善; 尽管许多结果并非来自对照实验, 书中的一些效果提升可能来自于其他因素。

工作中可能面临的一个决定是,是否要使用第三方产品进行个性化或优化。其中一些产品要求在HTML页面顶部插入一个JavaScript代码段。这些阻塞的代码段使页面速度显着降低,因为它们需要与代码段提供商进行往返并传输通常为数十KB的JavaScript(Schrijvers 2017,Optimizely 2018b)。这会导致页面闪烁。根据延迟实验结果,目标指标的任何增加都可能被延迟增加的成本所抵消。因此,我们建议尽可能使用服务器端的个性化和优化功能,即让服务器端进行变量分配(请参见第12章)并为该变量生成HTML代码。

在本书中, 我们的目标是展示如何衡量速度对关键指标的影响,而不是如何提高响应速度。

运行此类实验的另一个好处是,可以生成一个从性能到关键指标的的映射,基于这个映射,我们可以回答以下问题:

  • 绩效改善对收入的直接影响是什么?

  • 性能改善是否会产生长期影响(例如,减少客户流失)?

  • 对指标X有什么影响?通常,新功能的初始实现效率低下。如果A / B测试显示指标X下降,那么加快实施速度是否足以解决该指标下降问题?在许多情况下,新功能会稍微减慢网站或应用程序的速度,因此需要进行权衡,此映射会有所帮助。

  • 性能改进在哪里更关键?例如,对于用户必须滚动查看的元素(也称为“折叠之下”)增加的延迟可能不太重要。类似地,右窗格元素不太重要。

为了进行对照实验,必须要将响应延时作为唯一个干扰因素。一般来说,很难在短期内提高性能以提供一个干预组的版本,因为如果可以的话, 工程师们早就在产品中实现了。因此我们采用一种简单的技术:降低网站或产品的速度。通过降低响应速度的结果来预测提高响应速度的结果, 当然, 这需要基于一些假设。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容