数据分析思维

数据分析思维,是分析思维的引申应用。再优秀的思考方式,都需要佐证和证明,数据就是派这个用处的。如果分析思维是一种结构化的体现,那么数据分析思维在它的基础上再加一个准则:「不是我觉得,而是数据证明」。

数据分析思维也是面试中经常会被问到的。在面试中我经常会被问到“你认为数据分析过程中最难的地方是什么?”这其实就是在考察你的数据分析思维。因为最难的地方其实是对业务逻辑的理解,理解了业务逻辑你才有分析的思路,才知道该怎么去分析,而这一切只有自己真正做过项目才能够有真实的感受。

在早期,新人最好选择一到两个领域深入了解其业务,然后以此拓展边界

####怎么进行数据分析?

①细分

在细分方式上,主要有以下三种方式

1. 横切:根据某个维度对指标进行切分及交叉分析

2. 纵切:以时间变化为轴,切分指标上下游

3. 内切:根据某个模型从目标内部进行划分

②对比

对比主要分为以下几种:

1. 横切对比:根据细分中的横切维度进行对比,如城市和品类

2. 纵切对比:与细分中的纵切维护进行对比,如漏斗不同阶段的转化率

3. 目标对比:常见于目标管理,如完成率等

4. 时间对比:日环比,周月同比;7天滑动平均值对比,7天内极值对比

③溯源

经过反复的细分对比后,基本可以确认问题所在了。这时候就需要和业务方确认是否因为某些业务动作导致的数据异常,包括新版本上线,或者活动策略优化等等。

如果仍然没有头绪,那么只能从最细颗粒度查起了,如用户日志分析、用户访谈、外在环境了解,如外部活动,政策经济条件变化等等

衍生模型

例如

4P模型(产品,价格,渠道,宣传)

SWOT 模型(优势,劣势,机会,威胁)

PEST 模型(政治,经济,社会,科技)

波士顿矩阵

一、分析框架

分析也是有框架和方法论的,主要围绕三个要点展开:

一个业务没有指标,则不能增长和分析;

好的指标应该是比率或比例;

好的分析应该对比或关联。

举一个例子:我告诉你一家超市今天有1000人的客流量,你会怎么分析?

这1000人的数量,和附近其他超市比是多是少?(对比)

这1000人的数量比昨天多还是少?(对比)

1000人有多少产生了实际购买?(转化比例)

路过超市,超市外的人流是多少?(转化比例)

这是一个快速搭建分析框架的方法。如果只看1000人,是看不出分析不出任何结果。

二、数据思维的框架

如果你不能用指标描述业务,那么你就无法有效增长它。

每一位数据分析师都要有指标体系的概念,报表也好,BI也好,即使机器学习,也是围绕指标体系建立的。

下图就是一个典型的指标体系,描述了用户从关注产品、下载、乃至最后离开的整个环节。每一个环节,都有数据及指标以查询监控。

不同业务背景需要的指标体系不同,但有几个建立指标的通用准则。

好指标与坏指标

好指标应该是核心驱动指标。虽然指标很重要,但是有些指标需要更重要。就像销量和利润,用户数和活跃用户数,后者都比前者重要。

核心指标不只是写在周报的数字,而是整个运营团队、产品团队乃至研发团队都统一努力的目标。

记住是一个阶段,不同时期的核心驱动指标不一样。不同业务的核心驱动指标也不一样。

互联网公司常见的核心指标是用户数和活跃率,用户数代表市场的体量和占有,活跃率代表产品的健康度,但这是发展阶段的核心指标。在产品1.0期间,我们应把注意力放到打磨产品上,在大推广前提高产品质量,这时留存率是一个核心指标。而在有一定用户基数的产品后期,商业化比活跃重要,我们会关注钱相关的指标,比如广告点击率、利润率等。

好的指标还有一个特性,它应该是比率或者比例

拿活跃用户数说明就懂了,我们活跃用户有10万,这能说明什么呢?这说明不了什么。如果产品本身有千万级别的注册用户,那么10万用户说明非常不健康,产品在衰退期。如果产品只拥有四五十万用户,那么说明产品的粘性很高。

坏指标有哪些呢?

其一是虚荣指标,它没有任何的实际意义。

产品在应用商店有几十万的曝光量,有意义吗?没有,我需要的是实际下载。下载了意义大吗?也不大,我希望用户注册成功。曝光量和下载量都是虚荣指标,只是虚荣程度不一样。

第二个坏指标是后验性指标,它往往只能反应已经发生的事情。

活动运营的ROI(投资回报率)也是后验性指标,一个活动付出成本后才能知道其收益。可是成本已经支出,活动的好与坏也注定了。活动周期长,还能有调整余地。活动短期的话,这指标只能用作复盘,但不能驱动业务。

第三个坏指标是复杂性指标,它将数据分析陷于一堆指标造成的陷阱中。

指标能细分和拆解,比如活跃率可以细分成日活跃率、周活跃率、月活跃率、老用户活跃率等。数据分析应该根据具体的情况选择指标,如果是天气类工具,可以选择日活跃率,如果是社交APP,可以选择周活跃率,更低频的产品则是月活跃率。

指标结构

指标也有固有结构,呈现树状。指标结构的构建核心是以业务流程为思路,以结构为导向。

我们把金字塔思维转换一下,就成了数据分析方法了。

从内容运营的流程开始,它是:内容收集—内容编辑发布—用户浏览—用户点击—用户阅读—用户评论或转发—继续下一篇浏览。

这是一个标准的流程,每个流程都有指标可以建立。内容收集可以建立热点指数,看哪一篇内容比较火。用户浏览用户点击则是标准的PV和UV统计,用户阅读是阅读时长。

当你有了指标,可以着手进行分析,数据分析大体可以分三类,第一类是利用维度分析数据,第二类是使用统计学知识如数据分布假设检验,最后一类是使用机器学习。我们先了解一下维度分析法。

维度是描述对象的参数,在具体分析中,我们可以把它认为是分析事物的角度。销量是一种角度、活跃率是一种角度,时间也是一种角度,所以它们都能算维度。

数据模型不是一个高深的概念,它就是一个数据立方体。

上图就是三个维度组成的数据模型/数据立方体。分别是产品类型、时间、地区。我们既能获得电子产品在上海地区的2010二季度的销量,也能知道书籍在江苏地区的2010一季度销量。

数据模型将复杂的数据以结构化的形式有序的组织起来。我们之前谈到的指标,都可以作为维度使用。下面是范例:

上图就是三个维度组成的数据模型/数据立方体。分别是产品类型、时间、地区。我们既能获得电子产品在上海地区的2010二季度的销量,也能知道书籍在江苏地区的2010一季度销量。

数据模型将复杂的数据以结构化的形式有序的组织起来。我们之前谈到的指标,都可以作为维度使用。下面是范例:

将用户类型、活跃度、时间三个维度组合,观察不同用户群体在产品上的使用情况,是否A群体使用的时长更明显?

将商品类型、订单金额、地区三个维度组合,观察不同地区的不同商品是否存在销量差异?

数据模型可以从不同的角度和层面来观察数据,这样提高了分析的灵活性,满足不同的分析需求、这个过程叫做OLAP(联机分析处理)

数据模型还有几种常见的技巧、叫做钻取、上卷、切片。

选取就是将维度继续细分。比如浙江省细分成杭州市、温州市、宁波市等,2010年一季度变成1月、2月、3月。上卷则是钻取的相反概念,将维度聚合,比如浙江、上海、江苏聚合成浙江沪维度。切片是选中特定的维度,比如只选上海维度、或者只选2010年一季度维度。

谈到维度法,想要强调的是分析的核心思维之一:对比,不同维度的对比,这大概是对新人快速提高的最佳捷径之一。比如过去和现在的时间趋势对比,比如不同地区维度的对比,比如产品类型的区别对比,比如不同用户的群体对比。单一的数据没有分析意义,只有多个数据组合才能发挥出数据的最大价值。

我想要分析公司的利润,利润 = 销售额 – 成本。那么找出销售额涉及的指标/维度,比如产品类型、地区、用户群体等,通过不断的组合和拆解,找出有问题或者表现良好的原因。成本也是同理。

这就是正确的数据分析思维。总结一下吧:我们通过业务建立和筛选出指标,将指标作为维度,利用维度进行分析。

很多人会问,指标和维度有什么区别?

维度是说明和观察事物的角度,指标是衡量数据的标准。维度是一个更大的范围,不只是数据,比如时间维度和城市维度,我们就无法用指标表示,而指标(留存率、跳出率、浏览时间等)却可以成为维度。通俗理解:维度>指标。

分析若只是当一份报告呈现上去,后续没有任何跟进、改进的措施,那么数据分析等与零。

业务指导数据,数据驱动业务。这才是不二法门。

三、训练方法

以生活中的问题出发做练习。

这家商场的人流量是多少?怎么预估?

上海地区的共享单车投放量是多少?怎么预估?

街边口的水果店,每天的销量和利润是多少?怎么预估?

这些开放性问题起源于咨询公司的训练方法,通过不断地练习,肯定能有效提高分析思维。另外就是刷各种CaseBook。

四、通用的互联网业务模型

产品运营模型:以移动端APP为主体,以经典的AAARR框架学习,了解活跃留存的指标和概念,包括Acquisition用户获取、Activation用户活跃、Retention用户留存、Revenue营收、Refer传播,以及细分指标。

市场营销模型:以传统的市场营销方法论为基底,围绕用户的生命周期建立框架。包括用户生命周期,生命周期价值、用户忠诚指数、用户流失指数、用户RFM价值等。

流量模型:从早期的网站分析发展而来,以互联网的流量为核心。包括浏览量曝光率、病毒传播周期、用户分享率、停留时间、退出率跳出率等。

电商和消费模型:以商品的交易、零售、购买搭建而起。包括GMV、客单价、复购率、回购率、退货率、购物篮大小、进销存,也包含SKU、SPU等商品概念。

用户行为模型:通过用户在产品功能上的使用,获得精细的人群维度,以此作为分析模型。包括用户偏好、用户兴趣、用户响应率、用户画像、用户分层,还包含点赞评论浏览收藏等功能的相关指标。

五、产品运营模型 :AARRR模型


获取(Acquisition):用户如何发现(并来到)你的产品?

激活(Activation):用户的第一次使用体验如何?

留存(Retention):用户是否还会回到产品(重复使用)?

收入(Retention):产品怎样(通过用户)赚钱?

传播(Retention):用户是否愿意告诉其他用户?

获取部分一般需要评估的维度有:渠道的获客数量、获客质量等 。渠道数量和质量的指标有很多,要依据产品及公司业务模块区分制定,一般有:每日新增、累积新增、启动次数、首次交易户、首绑交易户、一次性用户数、平均使用时长等。

激活一般指注册激活、主动活跃、推送活跃、交易活跃等。例如显示这个APP的交易活跃明显大于主动活跃,那么可以推断这个APP是交易驱动,可能是一个电商或者理财类的APP。对于一些新闻、娱乐、社交类的APP,它们的主动活跃一般会高于交易活跃。

这里要特别说明的是注册激活部分。注册激活部分需要进行详细的页面埋点,列出影响注册激活的因素,对这些元素不断优化,最后提高产品的注册激活数量。

留存部分,一般,次日留存>3日留存>7日留存>次月留存。用户的留存量刚开始会下降的比较严重,到了后期会逐渐稳定在一个数量级上。稳定下来的这些用户,基本上就是产品的目标用户了。

留存还有很多指标,如:次日留存、3日留存、每日流失、每日回流、用户声明周期、平均生命周期贡献、7日回访用户、使用间隔、页面访问量、回访率等等。具体选定哪个维度进行统计要依据自己的产品和业务重新定制。

收入部分主要是公司的业务层面的数据,用户使用APP后,浏览了什么样的商品和服务,选了了什么商品和服务,最后支付了多少。关于固体交易金额的数据,第三方工具一般统计不了,公司也不可能把这部分数据接口开放给第三方,所以这块是需要我们在产品后台单独做埋点的。

整个支付环节的埋点一般有两个主要因素要考虑,一是看用户的支付支付体验是否顺畅,是否有一些页面卡主了用户,让用户无法进行交易。二是看在哪一个页面流失最高,用控制变量的方法调整流失率高的页面的栏位、交互等。

传播部分一般可以分成两个维度,舆情监控维度(包括用户的主动传播分享)和产品的引导分享维度。

大一点的公司一般都有专业的部门来负责舆情监控,会收集和处理一些负面的评论,积极传播产品的正面价值。

产品内部的引导分享可以参照上面的表格制定一些监控因素,最后统计数据,指导下一步工作。

注:埋点

做埋点的时候, 一般要做两张表格,一张是埋点事件表,一张是埋点统计表。

数据埋点事件表包括页面、事件名称、备注。一般是记录每个页面的交互事件,一般是后台记录次数。比如点击登录按钮的次数、点击获取验证码的次数,进入某个页面的次数、退出某个页面的次数等。

埋点统计表包括具体的模块,业务说明,备注。

六、用户生命周期模型

用户的生命周期,简单来说就是:用户从开始接触产品到离开产品的整个过程。


搭建用户生命周期模型的一般步骤如下:

业务逻辑梳理;

找到影响用户留存/消费的关键功能;

定义各阶段用户行为。

通用用户行为定义模板:


各个时期目标以及策略:

引入期:运营目标——获客;运营策略——优化渠道、提高注册转化率和下单转化率

成长期:运营目标——提升用户价值、引导用户多次购买,培养用户使用习惯;运营策略——抓住用户每一次需求窗口促进购买,提升用户购买次数,客诉及时安抚

成熟期:运营目标——维持忠诚度、促进传播;运营策略——促进N购、交叉营销、老用户关怀、鼓励传播

休眠期:运营目标——降低流失;运营策略——流失分析、流失预警、潜在流失用户召回

流失期:运营目标——召回用户;运营策略——流失召回、产品诊断与重新定位

注:贯穿各个生命周期的问卷调查

用户问卷调查是获取用户真实需求的有效手段,《增长黑客》中介绍的很多优化产品功能与运营策略,从而实现用户爆发式增长的例子,都始于用户调研。

问卷调查贯穿用户生命周期的各阶段,主要的调研节点有:

用户生命周期价值 :

生命周期价值是用户在生命周期内能为企业提供多少收益,它需要涉及财务定义。互联网行业更多提到生命周期,而不是生命周期价值,因为互联网的商业模式没有传统营销的买和卖那么简单明确。举个例子,微信用户的生命周期价值能否计算?并不能,不论是广点通、游戏或者微信理财,都推导不出一个泛化的模型。但是部分产品,如金融和电商,生命周期价值是可计算的。以互联网金融举例,某App提供理财和现金贷款两种业务,公司从这两个业务中获得收入通常是一个较稳固的比率,而成本支出平摊每个用户头上也是固定常数。所以利润就变成了用户理财和贷款的金额大小,以及生命周期的长短。这两者都是可估算的。生命周期价值比生命周期重要,因为公司要活下去,就得赚更多的钱,而不是用户使用时间的长短

七、 回访用户、流失用户和流失预警

回访用户:用户流失后,再次访问的用户。

用户回访率=回访用户(再次访问的已流失用户)÷所有已流失用户×100%

对于用户流失时间,我们有一个一般定义:用户回访率在5%-10%区间,这个区间对应的时间点及之后的时间,我们认为用户已经流失。

例如:


如果我们设定的流失期限较短,流失回访用户则较多,流失回访率也就较高。随着流失期限的延长,流失回访率呈单调下降趋势:在拐点处,用户回访率为5%,这个拐点对应的流失期限是10月,在10个月之后的用户回访率均低于5%。所以,我们认为,这款产品的用户流失时间,可以选择在用户停止发生XX行为10个月后,该用户即为流失用户

注意:

回访用户不仅仅是回来打开App的用户,要根据具体产品属性进行判断。对于理财类产品,回访用户指的是投资;对于工具类产品,回访用户指的是登录;对于社交类产品,回访用户指的是互动;针对内容型产品,回访用户指的是访问。

分析流失预兆:

针对已流失用户进行研究分析,找出他们流失前的共同点,如果当前的活跃用户在未来某一天出现已流失用户的相似征兆,则需要触发流失预警机制。

分析流失预兆步骤如下:

确定流失用户,分析用户流失前的行为;

假设用户流失的影响因素;

通过访谈,明确用户流失的行为路径。

分析流失用户流失前的行为,一般可以从以下几个方向进行数据分析:

用户流失前发生了哪些相似的行为;

用户是否集中在某一渠道;

用户属性是否一致;

流失前,产品、运营、市场是否发生某些变动。

注意:分析流失前的用户行为,我们只需要分析用户导入期、成长期、成熟期的数据。

设计预警机制:

根据上述得到的何为流失用户,以及流失用户在流失前的行为,我们就可以开始设计预警机制了。

分等级实现,根据流失前用户的行为指标,分别对这些指标赋予相应的权重,根据这些指标、权重进行计算,当数值高于XX值时,系统定义该用户具有流失风险,要么自动触发、要么将名单传输到运营手里,运营人工召回。

流失用户召回策略,用户进入休眠期或流失期后,我们可以采取以下几种方法来召回用户:

优惠刺激:使用租车平台进行租车的用户大多是价格敏感型用户,我们可以通过加大优惠力度来召回用户。对于在平台留下较多行为数据的用户,我们可以推送个性化优惠来提高召回成功率。提醒用户有未使用的优惠和会员权益,对于账户中尚有未使用的优惠券或会员权益的用户,我们可以对其进行“尚有未使用优惠”的提醒。

游戏化唤醒:邀请用户参与平台游戏(如抽奖),以游戏化的方式给用户新鲜感,提升用户的活跃度。

情感化唤醒:再现用户在平台上完成的旅程,并发送声情并茂的召回邮件。

客户/用户忠诚指数

忠诚指数是对活跃留存的再量化。活跃仅是产品的使用与否,A用户和B用户都是天天打开App,但是B产生了消费,那么B比A更忠诚。数据往往需要更商业的指标描述用户,消费与否就是一个好维度。

客户/用户流失指数

流失指数是对流失的再量化,它是忠诚指数的反面。流失率衡量的是全体用户,而为了区分不同用户的精细差异,需要流失指数。在早期,流失指数=1-忠诚指数。

流失指数和忠诚指数的具体定义能根据业务需要调整,比如忠诚按是否消费,流失按是否打开活跃,只要解释能站住脚。

在拥有足够的行为数据后,可以用回归预测流失的概率,输出[0,1]之间的数值,此时流失的概率便是流失指数。

八、用户分群模型:RFM模型 


客户/用户价值指数

用户价值指数是衡量历史到当前用户贡献的收益(生命周期价值是整个周期,包括未来),它是精细化运营的前提,不同价值的用户采取不同策略以最大化效果。用户价值指数的主流计算方式有RMF模型,利用R最近一次消费时间,M总消费金额,F消费频次,将用户划分成多个群体。不同群体即代表了不同的价值指数。

RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该机械模型通过一个客户的近期购买行为(Recency)、购买的总体频率(Frequency)以及花了多少钱(Monetary)三项指标来描述该客户的价值状况。体现了分类思维。

在R/M/F三个指标上,我们通过经验将实际的用户划分为以下8个区(如上图),我们需要做的就是促进不同的用户向更有价值的区域转移。也就是将每个付费用户根据消费行为数据,匹配到不同的用户价值群体中,然后根据不同付费用户群体的价值采用不同的策略。

九、多渠道归因问题的三种类型


十、流量模型

浏览量:PV,即页面访问量或点击量,用户每1次对网站中的每个网页访问均被记录1次。用户对同一页面的多次访问,访问量累计。

渠道到达量:俗称曝光量,即产品推广页中有多少用户浏览。它可以在应用商店,可以在朋友圈,可以在搜索引擎,只要有流量的地方,都会有渠道曝光。曝光量是一个蛮虚荣的数字,想一想现代人,每天要接触多少信息?其中蕴含了多少推广,最后能有几个吸引到用户?更多时候,渠道到达量和营销推广费挂钩,却和效果相差甚远。

渠道ROI:ROI是一个广泛适用的指标,即投资回报比。

市场营销、运营活动,都是企业获利为出发点,通过利润/投资量化目标。利润的计算涉及财务,很多时候用更简单的收入作分子。当运营活动的ROI大于1,说明这个活动是成功的,能赚钱。

PV(PageView)是页面浏览量,用户在网页的一次访问请求可以看作一个PV,用户看了十个网页,则PV为10。

UV(Unique Visitor)是一定时间内访问网页的人数,正式名称独立访客数。在同一天内,不管用户访问了多少网页,他都只算一个独立访客。

用户访问时长:是一次会话持续的时间。不同产品类型的访问时长不等,社交肯定长于工具类产品,内容平台肯定长于金融理财,如果分析师发现做内容的产品大部分用户访问时长只有几十秒,那么最好分析一下原因。

退出率:是网页端的一个指标。网页端追求访问深度,用户在一次会话中浏览多少页面,当用户关闭网页时,可认为用户没有「留存」住。退出率公式:从该页退出的页面访问数/进入该页的页面访问数,某商品页进入PV1000,该页直接关闭的访问数有300,则退出率30%。

跳出率是退出率的特殊形式,有且仅浏览一个页面就退出的次数/访问次数,仅浏览一个页面意味着这是用户进入网站的第一个页面,俗称落地页LandingPage。

退出率用于网页结构优化,内容优化。跳出率常用于推广和运营活动的分析,两者容易混淆。

K因子:每位用户平均向多少用户发出邀请,发出的邀请又有多少有效的转化率,即每一个用户能够带来几个新用户,当K因子大于一时,每位用户能至少能带来一个新用户,用户量会像滚雪球般变大,最终达成自传播。当K因子足够大时,就是快口相传的病毒营销。

国内的邀请传播,主体自然是微信朋友圈。微信分享功能和网页都是能增加参数统计的,不难量化。

病毒传播周期:活动、广告、营销等任何能称之为传播的形式都会有传播周期。病毒性营销强则强矣,除非有后续,它的波峰往往只持续两三天。这也是拉新的黄金周期。

另外一种传播周期是围绕产品的邀请机制,它指种子用户经过一定周期所能邀请的用户。因为大部分用户在邀请完后均会失去再邀请的动力,那么传播周期能大大简化成如下:假设1000位种子用户在10天邀请了1500位用户,那么传播周期为10天,K因子为1.5,这1500位用户在未来的10天内将再邀请2250位用户。

理论上,通过K因子和传播周期,能预测依赖传播带来的用户量,可实际的操作意义不大,它们更多用于各类活动和运营报告的解读分析。

用户分享率:现在产品都会内嵌分享功能,对内容型平台或者依赖传播的产品,分享率是较为重要的指标,它又可以细分为微信好友/群,微信朋友圈,微博等渠道。

有一点值得注意,数据只能知道用户转发与否,转发给谁是无法跟踪的。所以产品用物质激励用户分享要当心被薅羊毛。反正我转发都是给「文件传输助手」的…

活动曝光量/浏览量:传播和线上活动是息息相关的,这两者的差异不大。想要做好一个活动,单纯知道活动的浏览量是不够的,好的活动一定是数据分析出来的。

十一、电商和消费模型

GMV:Gross Merchandise Volume,是成交总额(一定时间段内)的意思。

在电商网站定义里面是网站成交金额。这个实际指的是拍下订单金额, 包含付款和未付款的部分。GMV指标不是实际的交易数据,但具有一定的参考价值。比如,实际支付占比的大小,可以切实反映买家购买行为和退单比例,并可进一步研究出顾客的购买意向以及市场整体交易情况。GMV数值可能远远超过实际成交金额.

对于资本市场而言,电商平台企业的快速增长远比短期的利润更加重要,GMV正是衡量电商企业增速的最核心指标。

客单价:传统行业,客单价是一位消费者每一次到场消费的平均金额。在互联网中,则是每一笔用户订单的收入,总收入/订单数。

很多游戏或直播平台,并不关注客单价,因为行业的特性它们更关注一位用户带来的直接价值。超市购物,用户购买是长周期性的,客单价可以用于调整超市的经营策略,而游戏这类行业,用户流失率极高,运营人员更关注用户平均付费,这便是ARPU指标,总收入/用户数。

ARPU可以再一步细分,当普通用户占比太多,往往还会采用每付费用户平均收入ARPPU,总收入/收费用户数。

复购率:若把复购率说成营收届的留存率,你就会知道它有多重要了。和新增用户一样,获得一个新付费用户的成本已经高于维护熟客的成本。

在不少分析场景中,会将首单用户单独拎出来作为一个标签,将两次消费以上的用户作为老客,之所以这样做,是从一到二的意义远不止加一那么简单。

用户第一次消费,可能是体验产品,可能是优惠,可能也是运营极大力地推动,各类因素促成了首单。而他们的第二次消费占比会有断崖式下跌(对应次日留存率的下跌),因为这时候的消费逐渐取决于用户对产品的信任,模式的喜欢或者习惯开始养成。

很多时候,用户决策越长往往意味着客单价越高,如投资,旅游。此时首单复购率越是一个需要关注的指标,它意味着更多的利润。

复购率更多用在整体的重复购买次数统计:单位时间内,消费两次以上的用户数占购买总用户数。

回购率是另外一个指标,值得是上一个时间窗口内的交易用户,在下一个时间窗口内仍旧消费的比率。例如某电商4月的消费用户数1000,其中600位在5月继续消费,则回购率为60%。600位中有300位消费了两次以上,则复购率是50%。

退货率:退货率是一个风险指标,越低的退货率一定越好,它不仅直接反应财务水平的好坏,也关系用户体验和用户关系的维护。

购物篮分析:购物篮分析不应限于电子商务分析,而是用户消费行为分析。

连带率是购物篮分析的一种指标,特指销售件数和交易次数之比。在大型商场和购物中心中,连带消费是经营的中心,用户多次消费即连带消费。在电商中是购物的深度,是单次消费提高利润的前提。

商品热度是一种快速见效的分析。可以将商品分为最热门Top20,最盈利Top20等,它依托二八法则,找出利润的抓手,很多营销会将它和连带率结合,像电子商务,重点推广多个能带来流量的热门爆款,爆款并不赚钱,而是靠爆款连带销售其他有利润的商品。这种流量商品连带利润商品的策略并不少见。

购物篮分析中最知名的想必是关联度,简单理解是,买了某类商品的用户更有可能买哪些其他东西。啤酒与尿布大概是最知名的案例了,虽然它是错的,但揭示了商品之间确实存在关联。

关联分析有两个核心指标,置信度和支持度。支持度表示某商品A和某商品B同时在购物篮中的比例,置信度表示买了商品A和人有多少同时买了B,表示为A→B。老王每次去菜场买菜都喜欢买一把葱,在老王的菜篮(购物篮)分析中,葱和其他菜的支持度很高,可是能说明老王买葱后就一定买其他菜(葱→其他菜)么?不能,只能说老王买了菜会去买葱(其他菜→葱)。除此还有提升度。 最有名的是Apriori算法。

关联分析并非只适用于购物篮,在很多营销场景中都会用它作为追加销售和交叉销售。常见有大额消费+现金贷,医疗健康+保险等,目的便是提高营收。

一、麦肯锡思维

金字塔原理

麦肯锡思维中很重要的一条原理叫做金字塔原理,它的核心是层次化思考、逻辑化思考、结构化思考。

什么是金字塔?任何一件事情都有一个中心论点,中心论点可以划分成3~7个分论点,分论点又可以由3~7个论据支撑。层层拓展,这个结构由上至下呈金字塔状。


看一下运营中典型的金字塔思维:

我们活跃用户数在下降(中心论点),主要原因是竞争加剧(分论点),其次原因是新用户减少(分论点),老用户流失加快(分论点)。其中竞争加剧是因为竞争对手ABC出现(论据),新用户减少是ASO排名下降(论据)和渠道投入疲软(论据)造成,老用户流失是因为产品欠佳(论据)。我建议……

这是合格运营的结构化思考。

结构化思考我建议利用纸或思维导图工具画出来。我说过,人是依赖经验思考的,擅长的是线性思维:因为-所以-最终,不擅长深度的结构思考。思维导图是一个非常好的工具,擅加利用,已经完成一半。例如《金字塔原理》书的思维导图:


结构化可以是三层,也可以拓展更多的分论点和层数。这一点大家想成我国语文教育中经典不衰的议论文作文模板:总-分-总结构(为什么作文要这样写,因为思路清晰,方便语文老师快速阅卷,用在思考是一样的道理)。金字塔思维则是总-分-再分。

金字塔原理有一个核心法则MECE,读作MeSee,全称Mutually Exclusive Collectively Exhaustive,中文意思是相互独立,完全穷尽。它指导我们如何搭建结构。

相互独立,说的是每个分论点彼此应该没有冲突和耦合,都属于独立的模块。完全穷尽,则是所有的分论点都被提出,不会有遗漏。这一点看上去容易,其实很难做到。

回到我们活跃数下降的例子,它提出了竞争加剧、新用户减少、老用户流失三个分论点。竞争加剧,竞争对手涌入,本来就意味着竞争对手会掠夺你的新用户,而ASO排名是非零和博弈,竞争对手上升你的排名就会下降,也造成新用户减少。两个分论点并不完全独立,违反了MECE法则。那么应该怎么分?

1.竞争对手出现:

竞争导致ASO排名下降

竞争对手掠夺了新用户

2.新增渠道疲软:

投入减少

3.老用户流失:

产品欠佳

如何划分分论点,我们可以用事物间的不同特性划分,它本质上也是一个分类问题,目的是找出事物(论点)之间的共性。

比如活跃下降可以从新老用户展开、可以从产品不同模块分析等等。分析思路不同,则分论点不同,核心依旧遵循MECE法则。当然很多分析结构已经有前人总结,属于套路,诸如运营的核心拉新促活留存。

结构强调的是穷尽,也就是越多越好,而随着分论点的增加,结构会更加复杂,不便于梳理和总结,所以分论点需要强调在3~7之间。

实际上我们很难真正做到穷尽,因为不了解的因素、隐藏的关键、信息不对称、经验等局限都会阻碍思维,做不到穷尽。如何找出尽可能多的分论点?这里列举我的心得,这不是麦肯锡方法。

你首先要找到一个万能公式。

绝大多数的商业项目、数据分析、业务讨论,都可以抽象成公式:

利润 = 销售额 - 成本;

销售额 = 购买人数 * 转化率 * 客单价;

购买人数 = 地区A购买人数+地区B购买人数+……

地区A购买人数 = 地区A新用户 + 地区A老用户;

此类公式均为小学难度,可很多分析项目就是能用公式化的思维和套路概括。因为项目本身是由三到四个核心因素决定,只要找到核心因素,就能将其组合。

接下来举一个具体问题:企业利润下降了,是什么原因?我们就能用公式分解出分论点。

是销售额下降了?还是成本上升?

如果是销售额下降,那么是购买人数少了?是客单价下降了?还是购买转化率降低?

以此类推,则能形成结构化的分析思路。

公式是一种思维框架,是一种经验导向的方法论,将你过去的经验总结和抽象,得到高度概括的因素。像利润这种都是再简单不过的商业理论,熟悉后就能快速使用。很多分析思维,在多年总结下,已经有成熟的解决方案。遇到问题,别急着画思维导图,不如先问问前辈和大牛们。经验会阻碍我们,经验也能帮助我们。

互联网行业的分析有点特殊,因为互联网的不确定性增加了。除了技术发展日新月异,用户需求不断改变,很多运营玩法也常常翻新。早几年标题党火爆,现在则注重内容价值的回归,曾经运营的核心是用户数,现在则是商业变现。这种快速变化导致分析思维也要有快速响应、学习和调整的能力。这方面,对互联网的分析是一种挑战。

对新人而言,很难一开始就掌握万能公式,但在具体的工作过程中,需要有意识的总结和提炼。另外分析中会有非量化的因素,比如团队士气、管理风格、员工忠诚度等。这是公式无法解决的缺点。

MECE是思考活动的技术和艺术,首先得有一个思考作为开始。这是什么意思?因为金字塔是从上而下,需要有一个中心论点,也就是塔尖。

什么是假设先行?就是以假设作为思考的起点。我不需要做全局的思考,而是先问出一个问题,然后思考解决它:我这款产品的特点在A功能吗?这款产品对用户们很有吸引力吗?我的活动如何在朋友圈引发传播?怎么让用户在活动中更爽?

在做出假设后,引导思维去挖掘分论点,然后分析。比如我希望活动传播,我要考虑哪些人会传播,他们是因为利益引诱还是情感触动?传播的过程应该什么样,方便还是复杂?这样的分析思维,比堪堪想一个空中楼阁的完美方案靠谱多了。

不管问题形式是如何、是否还是能不能,只要作出了假设,就能用MECE原则画出金字塔结构。不要想着从无尽的业务和数据中找出规律,这叫大海捞针。这种根据问题作为中心论点形成的结构化思维,叫做问题树/逻辑树 Issue Tree。

假设抽丝剥茧后的每一个论据都应该能用是或否回答。分析思维和数据分析不一样,数据分析追求数据的精确度,而分析思维不需要,只要能回答问题,是和否足够了。

假设会被否定或者拒绝,我认为产品对用户有吸引力,但是最后所有的论据,包括留存率、用户使用时长、功能使用率、用户评价都是否定,那么吸引力也就不成立,此时应该修改假设:产品的某一方面有问题,然后继续画新的问题树。

不要害怕修正错误的假设,不要寻找事实强撑错误的假设。

接下来谈剪枝。MECE虽然能画出详尽的结构,但不意味着我们要全部分析。维基百科案例中的IssueTree,有些分论点层层展开,有些分论点就嘎然而止。很多论点我们没有深入必要,需要对这部分论点论据舍弃,目的是找出关键驱动因素。

企业利润的关键驱动因素是利润和成本,用户吸引力的关键驱动因素是留存率。利润和成本还能再找出其中的细分关键因素,留存率也一样。这才是我们要的。

一旦找到关键驱动因素,可以基于此展开数据调研、取证、分析和结论,而不是对所有问题树开展。为什么需要围绕关键驱动因素?这里有一个新的核心法则,大名鼎鼎。

二八法则!

现在我们来理一下分析思维的思路:

提出假设—MECE原则(万能公式)—结构化分析—找出关键驱动因素—数据分析


二、了解SMART、5W2H、SWOT、4P理论、六顶思考帽等框架


七、波士顿矩阵

在传统以营销为主导的企业中,不论是日用品消费还是生产制造加工,企业一定有一系列的产品。波士顿矩阵认为,产品战略管理可以从两个角度衡量:市场增长率和相对市场占有率。

市场增长率是包括企业销售额、竞争对手强弱及利润高低的综合指标。而相对市场占有率则代表了企业在市场上的竞争实力。

这两个都是可量化的指标,将它们分别作X轴和Y轴,则能划分出四个象限。


图片发自简书App

在产品管理中,我们把高增长率-高占有率的产品称为明显产品,从财务报告上看,它总是能产生利润,但是高增长往往意味着高投资。某种情况下,它不代表着自给自足。如果市场份额处于垄断或者领先地位时,那么企业不必再维持投入以保持高增长,此时产品能源源不断地维持现金流,它被称为现金牛。

现金牛产品的特点是高市场份额和低增长率。产品已经迈入成熟期,其特征是产生大量的现金收入,数额远大于维持市场份额所需再投入的资金,是企业支持其他产品的后盾。

低增长率-低占有率的产品叫做瘦狗产品,这类产品对企业都是鸡肋,财务特点是利润率低、处于保本或亏损状态。这类产品往往会实行撤退或者整顿的战略。

低市场份额而高增长率的产品是问题产品,这些产品吸纳的资金总是多于所产生的资金。虽然高增长率意味着市场未来潜力好,但是份额不高要打上一个问号。不投入资金,产品会衰亡,即使投入资金,若只能勉强维持住市场份额。那么它最终仍属于瘦狗产品。

象限是动态的,明星产品的目标是成为现金牛,问题产品需要摆脱泥沼增加市场份额,而所有的产品都可能衰退为瘦狗。

八、矩阵思维

实际上,在我最初学习波士顿矩阵的时候,我对现金牛、瘦狗的概念依旧一知半解。但我牢牢记住了矩阵式思考,记住了象限划分。

何为象限?我们拿两个量化指标将分析对象划分出多个种类:高-高、高-低、低-低、低-高,对象落在了四个象限,它便是矩阵思维下的产物

例如电商领域:

大家都应该听过爆款产品,在淘宝店铺运营中,爆款产品意味着高曝光量和低利润率。这个词第一次听其他运营提及时,他们说很多爆款产品并不赚钱,往往是做高店铺的流量。当很多人被爆款产品吸引过来的同时,会去购买店铺其他正常利润的商品,这里还会配合优惠券做交叉销售,提高营收,这种方法是俗称的带量。

在你不知道矩阵思维的时候,可能只有带量这么一个概念。而学会了矩阵,你就能听出上述那段话的两个指标:曝光量和利润率。现在用它们划分出四个象限。


图片发自简书App

每种类别的商品对应不同的运营策略,潜力商品可以在后期运营中增长曝光量,培养搜索权重;鸡肋商品则要优化转化率。这里通过象限梳理清楚了基于商品的运营逻辑,避免无头苍蝇般的抓瞎。

矩阵思维的一个优点是方便归类和聚焦,它是可以指导策略的。

商品的象限维度不止曝光量和利润率。我们可以尝试曝光量-转化率,去分析商品落地页的效果,比如高曝光量-低转化率的商品,是不是设计和文案有问题?也可以尝试利润率-回购率的象限维度,衡量商品长期的盈利多寡,某个商品虽然利润低了些,但是用户会反复购买,那么它也是半个明星产品。

矩阵思维可以应用在商品运营、用户运营、人员管理、时间管理、用户行为分析、用户需求分析、产品功能分析等多个场景上。

它之所以是一种经典的思维框架,在于将无序的数据通过象限归类为了有序。当面对一堆数据或信息一筹莫展时,想一想矩阵的象限划分,它也许就是点燃闪电的火苗。

九、马斯洛需求层次理论

马斯洛理论把需求分成生理需求Physiological needs)、安全需求(Safety needs)、爱和归属感Love and belonging)、尊重(Esteem)马斯洛需求层次理论自我实现Self-actualization)五类,依次由较低层次到较高层次排列。在自我实现需求之后,还有自我超越需求(Self-Transcendence needs),但通常不作为马斯洛需求层次理论中必要的层次,大多数会将自我超越合并至自我实现需求当中。

通俗理解:假如一个人同时缺乏食物、安全、爱和尊重,通常对食物的需求量是最强烈的,其它需要则显得不那么重要。此时人的意识几乎全被饥饿所占据,所有能量都被用来获取食物。在这种极端情况下,人生的全部意义就是吃,其它什么都不重要。只有当人从生理需要的控制下解放出来时,才可能出现更高级的、社会化程度更高的需要如安全的。


应用:

企业经营消费者满意(CS)战略的角度来看,每一个需求层次上的消费者对产品的要求都不一样,即不同的产品满足不同的需求层次。将营销方法建立在消费者需求的基础之上考虑,不同的需求也即产生不同的营销手段。

根据五个需求层次,可以划分出五个消费者市场:

1. 生理需求→满足最低需求层次的市场,消费者只要求产品具有一般功能即可

2.安全需求→满足对“安全”有要求的市场,消费者关注产品对身体的影响

3. 社交需求→满足对“交际”有要求的市场,消费者关注产品是否有助提高自己的交际形象

4. 尊重需求→满足对产品有与众不同要求的市场,消费者关注产品的象征意义

5. 自我实现→满足对产品有自己判断标准的市场,消费者拥有自己固定的品牌 需求层次越高,消费者就越不容易被满足。

商业分析框架

1.第一层: 让更多的用户在更长久的时间内以更频繁的次数购买更昂贵的商品


用户在哪里,商业就会在哪里。我们用一句哲学的话概括。用户从哪里来,用户到哪里去,用户是谁?

更长久的时间,衡量的是用户生命周期(使用产品时间服务)。换一个接地气名词,叫做客户忠诚度。在互联网行业,也有另外一个指标:用户留存率。一是延长用户使用时间,二是防止用户离开。分析也可以从两种角度出发,如果拥有某种功能或服务,用户会不会更喜欢我们?如果砍掉某种功能或服务,用户会不会离开我们?很多功能和服务其实处于中间态,对用户的忠诚度不甚有影响。部分产品和服务,用户使用时间是受限制的。例如怀孕,一款孕期管理APP,最理想的用户使用时间就是十个月,商业模式也只能在十个月的范围内展开。如何延长使用时间?在APP中加入备孕功能是个不错的主意,在怀孕前,就让准妈妈们开始使用,另外则是往后推出新生儿相关的功能,那么产品的使用时间又近一步延长。备孕、怀孕、幼儿,横跨三个阶段的商业周期。

更频繁的次数,衡量的是用户的消费需求。不同的商业场景下,消费频次肯定不相同。消费频次分为刚性频次和弹性频次。结婚就是刚性的频次,一辈子基本只有一次。购物、出行、社交都是弹性频次。

更甘贵的商品,衡量的是用户消费能力。更昂贵重要,而更重要的是要产生购买的行为。这里先理清两个概念:价格和价值。价值是原材料、物流、研发的体现。价格是市场、品牌、公关、包装的体现。价值高的商品价格不会低,价值低的商品却可以价格高。发烧友的手机,情怀党的手机等细分市场的杰出营销。所以价值高于价格是商业的常态。

2.第二层:用更高的效率以更低的成本抢占更多的市场并且更好地满足用户需求

这一层不限于经营模式,而是管理模式。第一层的四个维度,并不能帮助商业模式活下来和活得久。因为企业需要盈利,第一层框架对应的只是GMV,而不是利润。第二层框架,就是商业管理框架,我们不仅要经营商业,还要能管理商业、控制商业。

更高的效率,这里的效率,不限于企业管理,也看资源的配置和运营。

引入成本,将商业分析的视角拔高到新程度。以第一层的框架为基础:更多的用户,获取一个用户或客户的成本是多少。这些成本能不能降下来?更长久的时间,为了一个忠诚用户需要多少支出,用户在使用产品和商品过程中产生了多少收益?用户用了产品两年我一分钱都没赚到怎么办?更频繁的次数?为了促销花费了多少,ROI是多少?更昂贵的商品,营销的费用是多少?客单价是多少?商品的生产成本是多少?这些成本后续支出能不能收回来?市场和运营的哪个环节投入,能够获得最大的回报?

市场份额可以粗略地划分实体和线上。实体受地理位置影响,比如北上广、中国市场、亚太市场、北美市场等。只要涉及实体,从超级卖场到烧饼铺,都脱离不开空间属性的影响。线上份额,即流量,是随着互联网兴起的新兴概念。如果分析商业的份额,一看用户量,二看使用时间量,三看金额量。如果要分析商业的竞争格局,一看份额总体预期,二看份额增量,三看竞争对手数量。

需要和需求。需要是一匹更快的马,需求是更快的代步工具,更深层次的需求是我能快速达到我的目的地。需要是明确表示得到的一个结果,需求则是驱动需要的深层价值。很多商业模式并没有理清楚需求,用户寻求的从来不是产品或者服务,而是解决方案。用户的消费、用户的忠诚都是围绕解决方案进。你能解决我问题,我才会对你忠诚。

第一层的分析,聚焦于商业模式如何经营,是否能活下去。第二层的分析,聚焦于商业模式如何管理,是否能活得久。除了主要维度,还有其他因素也会影响我们的分析,例如政策影响,例如宏观市场波动。这就是商业上的黑天鹅了。

3.第三层:用更好的创新搭建更大的生态延伸更多的领域。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容