数据的重要性毋庸置疑,所谓成大事者,三观要正。数据分析大致可以分为描述性数据分析、诊断性数据分析和预测性数据分析。
从分类不难看出,数据无非就是要有庞大的数据然后利用一定的技术进行预测。
那么数据常用的分析方法包括对比分析、平均分析、交叉分析等数。不同的人有不同的技巧和方法,当然目的是一致的。都是一定的方法(比如:机器学习)建立模型,预测数据。
那么数据分析又有各种各样的工具,常见的比如:Excel、SPSS、PYTHON、R还有其他的工具(比如:JMP、SAS、ALstat等),当然咯我最喜欢的事python。曾经闹出一个笑话,在做一个奖励机制,我用python吭哧坑次搞了好久搞出来了,然后一同事说这个用Excel不是很简单吗?仔细一想还真是,哈哈哈(这怕是python被黑比较惨的一次了)
哟,扯远了,是说产品与数据纠缠不清的关系,“数据”这个词,是产品经理永远绕不过的话题,很多产品对数据的理解任然是一团浆糊,甚至在做产品的时候从不考虑数据。就会有很多的理所当然的事情发生,最近发生了一件很有趣的事情,市场部门售卖一款产品,产品开始介入主导,做着做着发现业绩不行了,至于原因不得而知了,后来大佬调整,说按照原来的模式吧,还是销售部门的老套路,业绩突然就上去了。为啥?产品部门造出来的产品为啥市场不买账?(这里就不说原因了,以后再说吧,我想表达的意思是一定要有数据来支撑产品,不能瞎想,胡编乱造)
什么是数据分析?
数据分析就是提取有用的数据来指导实践。
1、数据不要流于形式,要以结果为导向。
2、数据可视化,这样便于发现数据背后提供的信息。
3、提取有用的数据,不是自嗨。
举个例子:互联网金融都会有渠道推广这个东西,比如有A B C D 四个渠道,可以统计从各个渠道过来的用户数量和在投金额。站在老板的角度就会选择花的钱最少,但是带来收益最高的那个渠道,也就是ROI最高的那个渠道。
如果再进一步细分,如果A渠道10个人带来了200万,B渠道300个人带来了200万,那么说明A渠道高净值人群比较多,如果和我们目标用户一样的话,可以重点维护!加大宣传投入成本,所以目的不一样,看的数据也不一样
1、入口分析
用户从哪些渠道进入产品,对比运营策略分析量多或量少的原因,提出优化方案。例如,你的app用户有从app store来的,有从不同的安卓市场来的,有从第三方渠道来的,有地推来的,有运营发布的文章来的,你需要分析从不同渠道来的用户数量和质量以及投入成本,就像我上面举得互联网金融的例子,通过投入产出比来选择渠道,同时通过每个渠道来的用户贡献程度,来分析出每个渠道的用户质量。
2、用户分析
分类用户群体,获取用户基本信息,包括地区、性别、职业等你的产品需要关心的元素;这一部分相当于用户画像,你可以通过自己建立的power BI系统来进行分析,也可以通过第三方提供的工具来进行分析,可以根据这些数据信息来做你的用户画像。用户画像的五个维度,可以参考我之前的文章《产品经理如何进行用户画像上》
统计新增用户、活跃用户、流失用户数据,思考如何刺激转化;这就是用户运营的工作,哪些是新增用户,哪些是活跃用户,哪些是流失用户。重点考虑新增用户的转化和流失用户流失的原因,以及定期做一些运营活动来促进用户的活跃。
3、事件分析
各个功能的使用情况,验证功能设计时的想法,有没有出现与设计时相悖的数据,例如 PV、UV、页面跳出率、页面停留时长、转化率这些指标。一件很有趣的事情,爱彼迎民宿刚上线的时候用户多转化率低,到后来转化率大大提升就是数据分析起到了主导性的作用。
4、漏斗分析
也叫做漏斗模型,比如一个p2p购买流程。
浏览标的—-》查看标的详情—》购买—》输入支付密码—》成功支付
你可以分析用户的每一个操作步骤,你如有100个人浏览你的标的,80个人查看详情,60个购买,5个人购买成功。说明用户在输入支付密码那一块漏的比较厉害,需要重点优化,这就是漏斗模型的作用。
我觉得对于产品来说,有两大流程需要进行漏斗模型分析。一个就是注册流程,这个决定了用户会不会在你注册环节流失。另外一个就是主要流程。例如电商的支付流程,金融平台产品购买流程和充值流程。
5、留存分析
次日留存、三日留存、月留存。所谓留存率,就是指一组用户在初始时间(比如首次打开应用)之后第 N 天,还在使用产品的用户比例(即留存下来的用户比例),一般称之为N 天留存率。对于留存率你要辩证的看,如果你是做的社交产品,那么留存率是一个很重要的指标。如果你做的是旅游机票这种产品,类似于携程,可能有的用户半年就买一次机票,买机票的时候才想起你,这种低频的使用产品,你再分析留存率就没啥意思。
总而言之,数据分析是一个很重要的产品需求来源,你自己提的想法可能不靠谱,老板的想法可能在天上,觉得运营提的需求太傻逼,但是数据永远不会说谎,
附上基本术语:
埋点:一般意义上的埋点,是利用如友盟、Talkingdata等第三方公司的SDK,通过在App中嵌入一段SDK代码,设定触发条件,当满足条件时,SDK会记录日志,并将日志发送到第三方服务器进行解析,并可视化地呈现给我们。这一过程就叫埋点。埋点方式也分“简单埋点”和“自定义埋点”,所谓“简单埋点”就是直接拿到第三方key,写到App代码的配置文件中即可。而“自定义埋点”则对应一种叫“自定义事件”的功能,一般第三方统计工具都支持,我们可通过设置“自定义事件”查看App特定的操作行为数据,如点击按钮次数、打开指定页面次数等,通常创建“自定义事件”都需要产品经理告知开发App的哪些条件下需要触发“自定义事件”,以及触发时要如何通过不同参数区分不同的点击行为。如同样是点击按钮事件,可通过设置参数“Action”,来区分Action=Yes和Action=No这两个按钮分别点击的次数。
维度:维度就是指我们平时看事物的角度,也可理解成分析一个数据能从哪些方面去分析,这些“角度”都是有值且可被枚举的。比如我们注册用户数有10万,那可分析的维度有:用户所在省份、用户性别、用户角色、用户来源等。不同维度来观察数据,可以得出不同结论,能否拓展观察维度,也是评估数据分析能力的一个关键。
度量:度量和维度相辅相成,是指可量化的数值,用于考察不同维度观察的效果,也可理解成“数据指标”。观察度量值可总体查看,如App总用户数,也可配合“维度”分层查看,如不同省份的注册用户数、活跃用户数,不同来源的App启动次数、平均日使用时长等。
渠道:指App的不同安装来源,如通过第三方应用市场安装,通过广告点击安装,通过地推二维码扫码安装,通过官网下载安装等。互联网公司的商务工作一般就是拓展渠道,观察不同渠道带来的数据表现,不断优化渠道质量。
新增用户:安装App后,首次启动App的设备数,需要按“设备号”去重。新增用户主要为了衡量推广效果,以及当前产品在整个生命周期所处阶段。
活跃用户:时间段内,启动过App的设备数,需要按“设备号”去重。活跃用户主要为了衡量运营效果,以及产品使用情况。
启动次数:时间段内,启动App的次数,无需去重。启动次数主要为了衡量推送效果,以及App的内容是否足够吸引人。
留存率:时间段内的新增用户,经过一段时间仍启动App的用户,占原新增用户的比例。“时间段”的划分方式有:按日、按周、按月,对应指标还可细分为“日留存率、周留存率、月留存率”。而“经过一段时间”的划分方式有:次日、7日、14日;次周、+2周;次月、+2月等。一般一款App的次日留存率为30-40%,次月留存率为20%,已经算是不错的成绩了。
使用时长:时间段内,从启动到结束App使用的总时长。所谓“结束App”,通常指杀掉进程,或者将App退到后台超过30秒。一般会按“人均使用时长、次均使用时长、单次使用时长”分析,衡量产品粘性和活跃情况。
使用频率:用户上次启动App的时间,与再次启动的时间差。使用频数分布,可观察到App对用户的粘性,以及运营内容的深度。
介绍几个常用的数据分析思路:
对比:字面上理解,就是非孤立地看数据,而是多个数据提取进行比较。根据对比方法不同,分为“横向对比”和“纵向对比”。
横向对比:指空间维度的对比。相当于一个指标,在不同条件下的对比,但每个条件都属于一个层级。举个例子,App功能的A/B测试数据对比,各个渠道的新增用户对比,都属于横向对比。
纵向对比:指时间维度的对比。一般的对比方法有:同比、环比。同比一般指是指本期数据与上年同期数据对比,环比则是本期统计数据与上期比较。观察时间轴上的数据折线图来判断产品运营状态也是一种纵向对比。
拆分:分析这个词,从字面意义上理解,就是“拆分”和“解析”,当某个维度对比后发现问题需要找原因时,就需要进一步“拆分”了。举个例子,如果发现某日的销售额只有昨日的50%,就需要对销售额指标拆分为:成交用户数 x 客单价,而成交用户数 = 访客数x 转化率。那么我们接下来就可分别针对:访客数、转化率、客单价,观察今日和昨日相比的数据变化,找出原因。
降维:当维度太多时,我们不可能全部分析,这时就要筛选出有代表性的关键维度,去除掉那些无关数据,这就是“降维”。比如“成交用户数 = 访客数 x 转化率”,当同时存在这三个指标时,其实我们只要三选二就能得出结论了。
增维:增维和降维是相对的,如果当前观察的维度无法解释当前问题,就需要对数据进行运算,多增加一个指标。在可视化分析领域,也可将不同类型的图表嵌套使用,能达到增加信息展现维度,扩展分析广度的目的,如下图所示:(将环形图和折线图进行增维嵌套)。
分组:也可叫聚类,合适的分组能更好地理解业务和场景。例如用户画像过程,就是一个按不同维度对数据分组的过程。通过用户画像,可以很清晰地知道产品的用户地区、用户兴趣、用户年龄、用户性别等属性占比,产品经理可通过画像进一步了解用户需求。
漏斗分析:主要用于分析产品使用的关键路径,通过设定一系列操作步骤,统计每一步中的操作用户数,并将用户数以柱状图纵向排列,就可形成用户流失漏斗,我们可分析漏斗每个环节的流失率,并观察改进环节交互体验后,流失用户的变化情况,以此来验证改动效果。
漏斗分析模型
AARRR模型:该模型一般用于游戏数据分析,是Acquisition、Activation、Retention、Revenue、Refer,这五个单词的缩写,分别对应一款移动应用生命周期中的5个重要环节。AARRR本身是一个循环,使用者需观察每个环节的数据情况,以此来分析产品是否在执行一个正循环过程。这其中的任一环节除了问题,都会导致产品数据的异常。
AARRR模型
最近迷上了python做数据分析,发现这东西越来越有意思。有没有感兴趣的一起学习一下