《数据化运营速成手册》,作者胡晨川,第二章建立数据图表的认知
没有正确的图表,只有更适合的图表。
在这一章里,作者介绍了各种图表的特点和使用场景,这里也来简单整理下。作者将数据图表分为两类:一类偏重展示,一类偏重研究。
偏重展示的图表,是为了更直观的表达某些指标,这些信息可以用来决策,比如使用柱状图,谁高谁低都很清楚;
偏重研究类的图表,展现的是指标间某些隐藏的关系,这些信息需要进一步研究才可以使用,比如散点图,具体的关系还需要我们再去验证才行。
散点图
散点图的价值在于发现变量之间的关系
散点图可以用来做相关性分析,来看两个变量之间是否存在某种关系,正相关,负相关这种,详情可以参考之前的文章:常见图表-散点图
要制作散点图,最少有两个变量,还可以有3个变量,演变成气泡图,当其中一个变量是时间的时候,我感觉就变成了折线图。4个变量的话也可以做,但是就要用到手动来调整,我感觉还是不要用了,太费劲
这里作者还提到了波士顿矩阵,也可以叫做象限法,分成几类来对比,主要得选择好基准值。Excel里面不太好做,这里可以手工来调整,比如插入图形,自己拖拽出那种效果,
调一下透明度就好了。
散点图的使用也有局限性,比如变量不要太多,控制下数量,而且选择哪两个变量,也是门儿学问,需要多了解业务。
柱形图
柱形图的核心思想是对比
柱子是竖起来的叫柱形图,横着的叫条形图。部分内容可以参考之前的文章:常见图表-柱形图
结构变化对比
柱形图是最容易作出对比效果的图形,其中使用堆积柱形图,可以看出每一部分占总体的比例和变化。
这里要注意对比的柱子不能太多,作者提到不要超过4个,太多容易混乱,最好还是2个对比。
多指标组合对比
当我们在多个主体上有多个指标要进行对比的时候,像这种
就可以选择普通的柱形图,这种场景下要注意下指标的单位,单位要一致才好在一个坐标轴上展示,比如:新用户订单数、老用户订单数。
如果遇到了单位不统一的情况,需要对指标进行标准化,可以参考之前的文章:数据标准化小记
最简单常用的是Max-Min标准化方法,标准化后,不同单位的指标就可以在一个图中展示了。
双向条形图-巧妙运用平均值
这个图以前还真没用过,找场景去试试,看上去是不错的
很明显,这个双向条形图的对比效果更好,不错不错
瀑布图-观察总量分解后的对比
瀑布图也没有用过,刚试了下,很好玩儿,效果也不错,直接用上面城市的数据来做的
通过瀑布图的拆解,我们可以发现一些问题,然后还需要结合维度下钻或者继续拆解去找寻原因。
正确对比数值指标和比率指标
这里就是组合图的使用了,比如这个
这里作者提到一个主坐标轴和次坐标轴刻度线一致,这个我并没有找到设置的地方,记录下,后面找到了再说。
使用柱形图、条形图、瀑布图,都是为了将对比的信息放大,更加直观的展示;
柱形图适合用来做结论表达;
柱形图一般不用在时间维度的变化;
柱形图的Y轴一般从0开始,除非为了隐瞒真相或误导读者
折线图
折线图的核心思想是趋势变化
通常折线图会和时间序列一起使用,下面整理几个知识点。
趋势线
在折线图中加上趋势线,可以更好地指导趋势变化,是在增长还是下降。
有了趋势线,我们通过趋势线的公式,可以看出趋势变化的速率是否是期望中的看折线图的波动情况
看它是剧烈波动还是平稳上升/下降,波动越大说明情况越不可控,企业都希望增长平稳且快速观察指标的周期性变化
在某些业务场景下,指标会呈现周期性变化,零售中一般都是一周为一个变化周期关注极值
关注折线图中明显的峰值和谷值,排除上面的周期性因素后,任何的高点和低点都不会凭空产生,我们需要去找到原因关注结构性变化
这个和极值有点儿类似,主要是关注指标再某些节点前后表现,比如上升不然变成下降的点,反之亦然,这样的点就是拐点,找到背后的原因,对业务有很大的意义。