《精益数据分析》这本书讲的主要是为什么以及如何来应用数据分析进而帮助初创企业更好地发展,但同时,这些数据分析的方法也对我们其他的工作与生活有所启迪。它的核心在于如何找到一个最有意义的指标,通过实验改变它。
在第一章“我们都在说谎”中,作者鲜明地借助现实扭曲场的概念指出了在创业的过程中过分依赖经验主义,选择性地相信自己想要相信的东西的灾难性的后果。随后,作者借助“最小可行化”产品的概念提出了概括性的数据分析框架,即先根据经验提出假设,然后只造出足以验证假设的产品,暂时不管其他的细枝末节,再通过各种统计手段收集数据、分析数据,以确定假设是否成立。
在第二章“创业的记分牌中”,作者主要介绍了各种数据指标的分类以及如何找到一个核心的指标。首先,作者认为好的数据指标需要简单易懂,并且能够根据不同的时间而具有比较性。以比率为例,一个比率指标的高低代表了两个数量指标的此消彼长的关系,蕴含了足够多的信息,具有较高的概括性。接下来,为了找到一个值得追踪的数据指标,作者辨析了一些指标类型的概念:
定量指标是结构化的,可以使用数学/统计的手段分析处理,但往往缺乏洞察力。而定性指标是基于经验的,有较强的洞察力,但却不够灵敏。因此二者往往需要结合起来才能有最大的效用。
虚荣指标指的是那些看起来花好月圆、蒸蒸日上的指标,实际上却不能反映企业真实的状态的指标。反之则为可付诸行动的指标。
探索性指标/先见性指标在于发现“自己不知道自己不知道的”的事实,是那些能够帮助企业预测未来的指标,例如一个城市常住人口的增多将预示着房价的升高一样。而报告性/后见性的指标则是对于已经发生的事情的总结与分析,帮助我们认清现实,如人口普查。
因果性指标一定属于相关性指标,而相关性指标却不一定具有因果性。两个具有类似变化趋势的指标是相关的,但需要进一步的控制变量的验证才能确定其是否同时具有因果性。相关的指标为你提供预见未来的能力,而在此基础之上因果指标还让你可以改变未来。
在介绍过数据指标的种类之后,作者又介绍了数据分析中几个经典的概念:
市场细分/用户画像:简单理解就是将具有共同特征的用户划为一类。你不需要让世界上所有人都喜欢你的产品,但是你需要清楚你的产品更适合哪一部分的人,并进行集中定点爆破。市场细分还可以帮助你对不同的用户群体采用不同的营销策略,扩大受众面。
同期群分析是纵向的分析方法(考虑了时间的因素),提供了两个维度的分析。例如,如果我们把新注册的用户视为一个群体的话,那么一个月前新注册的用户和现在新注册的用户之间就可以进行对比分析。同时一个月前新注册的用户的数据和同一批用户在现在的数据之间也可以进行对比分析。这样我们就可以观察到一个用户在使用我们的产品期间整个行为的变化,同时也可以观察到在不同的时刻开始使用我们的产品但使用了产品同样长时间的用户之间行为、体验的区别。
A/B test 是一种控制变量的实验方法,是横向的研究方法(在同一时间段内),在其他条件不变的情况下,通过测试来决定对于某一属性是选择A 还是 B。但是在实际的操作中,往往很难保证其他条件不变。不过好在当测试的样本足够大的时候,其他条件的一些零碎的区别就可以被忽略了。但是对于创业公司来说,可能一时间无法获取足够大的测试样本,这时就不得不对很多的因素单独的进行检验,很耗时间。在这样的情况下,则可以采用多变量同时测试多个自变量对因变量的影响,最终可以获知单个自变量对因变量的相关性。
最后,作者提出了“精益数据分析周期”,大概可以用文字阐述如下:
首先,根据经验提出一个KPI,例如营收,并设定一个阈值。其次,通过头脑风暴,调研的出的定性结果,或找出提供高KPI用户的共性,以及提供低KPI用户的共性,最终提出可能提高KPI的方法/假设。然后,同时A/B test 或者多变量测试去初步验证假设的有效性(因为直接实现假设进而检验假设的方式的风险和成本都过高)。若假设通过测试,则将其在实际产品中实现,并收集数据观察实现前后用户行为的变化(可以同期群分析),以及改变后的产品是否获得了一个令人满意的KPI。如果改变后的结果不尽如人意的话,则可以更换假设,改变阈值(有充足依据地),更换KPI(有充足依据地)。