前言
在互联网公司,进行设计方案评审时总会有人说“拿数据说话”,也能听到一些词,比如:“数据驱动”。数据驱动在一定程度上能揭示用户的行为和习惯,而通过关键数据指标能帮助产品经理理解:是谁,他在平台上干了什么,结果怎么样了。可见,关注数据指标是一个产品经理应当具备的能力。
PS:此文一定不是2岁以上运营喵的粮,更不是资深产品狗的菜,出门右拐,谢谢~
此文的阅读对象:1.对数据分析没有概念但又感兴趣的朋友,2.对数据分析有概念平常工作中也能涉及到,但不知道如何计算才正确的朋友。
一、什么是数据指标?
工作中的许多问题,都来自于数据指标的不清晰所导致的“认知”不在同一层次上的问题。
关于什么是数据指标,不同的人理解也不同,并不是所有的数据都可以叫做指标,数据指标一定是对当前你所做的业务有参考价值的可统计的数据。只有这样,这一个或者多个数据才是来自于业务,落地于业务,并真正对业务产生价值的。
二、数据指标有哪些?
常见的数据指标有三种:
第一、用户数据:也就是我们在前言里讲的(谁)
第二、行为数据:也就是前言里讲的他干了什么(以后会写)
第三、业务数据:结果怎么样了(以后会写)
这一篇文章咱们只讲用户数据,不知道你去菜市场买菜不,不管你买不买,咱先拿卖菜举个栗子:如果你是菜市场的摊主,首先,你会不会关心每天/周/月有多少人来这个菜市场,有多少人会买你的菜?这里就需要用DAU/MAU来描述。
然后呢,你会不会关心今天买你菜的人有没有比昨天多?这里呢我们需要用新增用户来描述。
你还会关心前天来的那个小姐姐或小哥哥(大妈也行)昨天有没有来,今天还会不会来?这里就会用到留存率。
最后呢,你时不时的还会想这些小姐姐/哥哥们来你这买菜之前,他们是从哪来的?是从菜场对面的小区来的,还是从隔壁摊位的大爷家来的呢?这就是另一个数据指标:渠道来源。
通常,你从这4个方面去观察用户群体,大致你就能得到关于这个产品里面用户概览的情况。
三、用户数据的各个指标是怎么定义的?
数据指标的计算也是有门道的,不扒不知道,一扒吓一跳,不一样的数据指标有不一样的定义方式,不一样的定义方式,数据也完全不同。首先呢,咱们扒扒日/月活跃用户和新增。
1.日/月活跃用户(Daily/Monthly Active User)
Daily(日)
一般说到日活跃用户,我们自然想到的是一个自然日,但你的菜铺如果搬到互联网上,并且菜卖到国外了,以全局的视觉来看你的菜铺,那daily就需要关注最近24小时的数据了。
Monthly(月)
月活顾名思义,是月活跃用户,那月活怎么算?
还拿你的菜铺为例:刚说你的菜铺搬到了互联网上,通过七大姑八大姨的支持,第1天,来了20个用户,从第2天到第30天,你的菜铺没有新增一个用户,并且这20个七大姑八大姨并不是每天都来,今天大姑来,明天大姨来,那你的菜铺的MAU(月活)是20,月活并不是当月各日DAU之和,所以,月活务必去重,这样你的数据才有观察意义。
Active(活跃)
这里呢有两个统计方法:
第一,基于事件上报的第三方数据统计平台:
有事件上报(指用户进行了主动操作)就表示该用户活跃,比如用户打开了你的菜铺网页,点击了加入购物车按钮这都是没有问题的,但是这里需要注意的是,你菜铺有个活动,推送了一条消息,用户不小心点到了,这类基于后台上报消息的事件,不是用户主动操作的,则不能被算为用户的活跃。
现在的一些预制报表的统计系统比如说友盟、GA都是基于事件上报进行统计,所以在跟研发沟通时,千万要定义清楚上报哪些事件。
第二、基于业务定义的关键事件:
举个栗子:你定义进入你菜铺首页这个事件作为日活,但是,当你的菜铺在给一款白菜做活动时,推送消息的内容是这款白菜的详情页,那么这个事件就被漏掉了,这显然不是合理的,所以,你需要建立一个事件list,把这些你定义的关键事件管理起来,并广而告之(团队相关成员都需要知道,以达到认识统一)。
User(用户)
有这几种情况,一个用户通过手机端和PC端分别访问了你的菜铺,多个用户通过一部手机或者一台电脑访问你的菜铺,那你是认设备还是认人?
认人:你的菜铺肯定是认人,因为电商类的产品有账号体系,并且业务场景强依赖登录,不登录没法购买,所以,你需要认人,你只需要用UserID来计算日/月活就行了,另外还需要一个指标来统计一些没有登录的用户数,因为这部分用户还是有价值的,但是你不能把这部分用户混合到日/月活里。
还有另外一种产品,它不是强依赖登录的,首先,确认这些不登录的用户对业务有没有价值,比如一些社区类产品,不登录用户也能浏览内容,这里认人就行了,但是还需要一个指标单独来统计一些没有登录的用户数。
认设备:还有一些产品不登录的用户对业务来说也有价值,比方说一些天气类的,日历类的APP,这个时候认设备就可以了。
好啦,说完DAU/MAU之后,咱们来谈谈新增~
2.新增
不同的角色对新增的定义也是不一样的,所以各角色间达成共识很重要。
新
那怎么判定新,这里呢有两种方法,
第一、基于设备:看当前的设备是不是第一次来到你的平台,如果是,那就是新增用户。
第二、基于账号:与后台已有账号进行匹配,如果没有,那就是新用户。
增
下面从四个方面来阐述一下“增”在不同的节点的优势和劣势:
第一、点击渠道链接直接访问:它的优势是统计简单,劣势是离激活环节远,转化率太差了,这种一般适用于这个渠道或者自己的产品量级不大,或者是这个渠道是免费的,又或者是你的产品不需要做精细结算。
第二、以下载来定义:这种的优势是用户愿不愿意用你的产品能直接的反映出来,劣势是数据源可信度存疑,无法真正避免刷量。这种一般适用于你的产品投放的渠道特别依赖于应用商店。
第三、启动:优势是离激活最近,也便于统计,劣势是无法避免刷量,有时候渠道也不一定配合。这种场景一般适用于产品的用户量级很大,这样渠道会给你定制统计的规则。
第四、激活:这是最真实的数据,但是渠道费用会很高,因为统计太复杂了,这种场景比较适用于对用户质量要求很高且产品的ARPU(每用户平均收入)高。
三.留存
那留存怎么算呢,还拿第一篇的例子来说:刚说你的菜铺搬到了互联网上,通过七大姑八大姨的支持,第1天,来了20个用户,从第2天到第30天,你的菜铺没有新增一个用户,并且这20个七大姑八大姨并不是每天都来,第二天13个大姑来,第二天7大姨来,...第七天,只有5个大姑来,那你的菜铺的MAU(月活)是20,这是毋容置疑的,但是你的菜铺的7日留存是什么呢?
这里有两种算法:
第一种算法 :第7天 日活跃用户数÷第1天日活跃用户数×100%
第二种算法 :第2天日活跃用户数~ 第七天去重后÷ 第1天 日活跃用户数×100%
第三种算法:第7天 日活跃用户数÷第0天 日活跃用户数×100%
那到底用哪一种算法呢?这个要看你的目的是什么。
1.第一种算法:7日日留存
只关心特定日的留存情况,避免了其他日的数据干扰
如果想了解某一个渠道的质量,以日为单位,衡量这个渠道来的用户当下或者是接下来的表现,这里我们用第一种算法。
为什么呢?
下面我们用图一来算一下7日留存:
1月份的七日留存=5÷20×100%=25%
2月份的七日留存=6÷18×100%=33%
在这里我们均使用第1日与第7日的数据,就算是我们忽略了一部分信息,但是我们也是对等的忽略,所以,可以“公平”地比较。估这里用第一种算法比较合理。
那我们再来看看第二种算法
2.第二种算法:7日内留存
引入了其他日的数据,适用于有固定使用周期,且周期较长的业务
也就是说把第2天到第7天的数据全部加在一起去重之后,再除以第1天,这种算法在菜铺这种产品类对比渠道质量不适合,因为第二种算法引入了第二天到第六天的数据,反而会影响判断。
但它在某些特定的产品比较适用,比方说最近很活的在线办公软件,因为这类产品用户访问时特别集中,像在线办公类的一般都是周一到周五使用,像这类的产品如果只看DAY7来评价,往往不能反映真实情况。我们此时关注7日内的活跃情况就更能描述渠道的质量。
所以在计算之前要明确自己的产品特性,其实大部分产品都是适合用算法一的。
3.第三种算法:7日日留存
新增当日为第0天,下一日为第1天,使第7天与新增当天对齐
算法三在星期这个维度上是对齐的,如果我们的产品跟星期几挂勾,比如星期一和星期天的日活相差很大,第三种算法的分子分母星期相同,某种程度上能抵消星期级别带来的数据波动。
4.正确的认识留存
我们上面讲了了解某一渠道的质量要以天为单位,来衡量这个沟道的用户当下或者接下的表现,我们看日留存,那么留存这里还有另外两种衡量的维度,一个是周留存,别一个是月留存。
当我们需要去观察整个大盘的趋势,这时候以周或者月为单位,来衡量产品的健康情况,观察用户在平台上的黏性,这个时候会用到周留存或者月留存。
算日留存时,我们用
日留存=指定日 日活跃用户数÷第1日 日活跃用户数×100% ,
那在算周留存或者月留存时也是用:
周留存/月留存=指定周(月) 周(月)活跃用户数÷第1周(月) 周(月)活跃用户数×100%
7日日留存=第7天 日活跃用户数÷第1天 日活跃用户数×100%
那么同理:
次周周留存=下周 周活跃用户数(去重后)÷当周 周活跃用户数(去重后)×100%
30日日留存=第30天 日活跃用户数÷第1天 日活跃用户数×100%
次月月留存=下月 月活跃用户数(去重后)÷当月 月活跃用户数(去重后)×100%
我们在计算留存时一定要结合具体的业务背景,灵活运用公式计算留存率。
四.渠道来源
网站渠道来源是指用户进入渠道的路径,不同的网站统计工具与分析工具对流量获取的渠道各有差异,但基本上可分为下面五个渠道:
1.直接访问
直接访问指的是用户直接访问网站,而不是从其他网站或搜索引擎进入的。一般有在地址栏输入网址访问网站,从浏览器收藏夹访问或点击 聊天工具里的链接等,这里需要注意的是,许多数据工具如果统计不到用户的渠道来源,也会默认其为直接访问。
2.引荐流量
引荐流量指的是从用户非搜索引擎与社交网站点击链接进入网站。比如从百度知道或者百度贴吧进到网站的流量。
3.自然流量
自然流量指的是从搜索引擎自然搜索结果进入网站的流量 。
4.付费搜索
付费流量就是通过搜索引擎竞价获取的流量,如下图
5.社交媒体
社交媒体顾名思议就是从各大社交平台进入网站的流量,比如微博、微信等。
好啦,留存和渠道来源这部分就聊完啦,一张图总结一下这篇文章的内容:
由以上可以看出,看似简单的数据指标,定义方式有很多种,不一样的定义方式会得出来完全不一样的数据,如果你不了解数据指标真正的定义是什么,那这个数据指标就没法真正的去还原业务的真相。