数据分析整体思路如下:
- 提出开放式问题,探索所有可能性。
- 指定输出结果。
- 确定改变输出结果的分析单位。
- 找出产生差异的解释变量。
- 确定分析方法。
- 开始分析。
一、开放式提问
什么是开放式问题?开放式问题是相对封闭式问题而言的,封闭式问题指的是能用“是”或“不是”作答的问题。
开放式提问的要点有哪些?参考5W1H原则。
- When:时间
- Where:地点
- Who:人物
- What:事件
- Why:原因
- How:如何
举个例子,“对广告有深刻印象的人光顾频率高?”将这个封闭式问题转换成开放式提问——“光顾频率高?”
- When:什么时间段光顾频率变高?
- Where:在哪里的店铺光顾频率高?
- Who:光顾频率高的顾客是什么类型的?
- What:提高光顾频率的因素有哪些?
- Why:为什么光顾频率高?
- How:如何提高顾客的光顾频率?
注意:难点在于找出Why的答案,这需要综合分析Who、Where、What三个要素。
二、输出结果
输出结果,指期望得到的指标,与利润直接挂钩的指标。
什么是利润?利润=销售额-成本。能体现销售额或成本的指标可设为输出结果。
注意,很多时候数据并不会包含利润项,也不存在体现销售额或成本的项,这时候怎么办?
- 可以将购买频率或光顾频率等与销售额直接相关的指标设为输出结果。
- 也可将员工数或滞销库存数等与成本直接相关的指标设为输出结果。
三、分析单位
分析单位,是构成输出结果的单位。比如,顾客、商品、员工等。
如何确定分析单位?根据4W1H原则进行梳理,这个原则是前面的5W1H原则,去掉Why剩下的内容。
- When:秒、分、时、日、周、月、年……
- Where:国家、城市、店铺、仓库……
- Who:经销商、合作伙伴、员工、顾客……
- What:商品类别、包装、手续处理……
- How:广告、促销……
注意:一般围绕Who、What确定分析单位。
选择分析单位时,需要注意什么?
- 从数据中能挖掘出的分析单位比较多。
- 确定影响输出结果的分析单位后,就能提出解决方案。
- 解释变量能从数据中定义,且能体现分析单位的特征。
四、解释变量
解释变量,是能解释分析单位“如何不同”的要素。例如,如果分析单位是顾客,那么年龄、性别、之前是否购买过等要素就是解释变量。
五、分析方法
数据可以分为定性数据和定量数据。按照数据的性质,如果确定了解释变量和输出结果的数据类型,就可以按照下表所示的方法来选择分析方法。
解释变量 | 输出结果 | |
---|---|---|
定量数据 | 定性数据 | |
定量数据(单个) | (一元)回归分析 | 逻辑回归 |
定性数据(单个) | 每个类别的均值汇总和t检验 | 每个类别所占比例的汇总和卡方检验 |
多个解释变量 | 多元回归分析 | 逻辑回归 |