这年头,不会点数据分析,都不好意思投简历找工作。
可是说起来容易做起来难,数据分析究竟是什么鬼?
不会HPCC也不会Hadoop,只会Excel可以吗?——答案是,可以!
对于非科班出身的人来说,Excel就是最接地气的数据分析工具。Excel中有自带的数据分析工具箱,只不过默认情况下,这个工具箱不在菜单栏中,要自己把它找出来哦。
在Excel工具箱中有多个数据分析,有相关系数、协方差、指数平滑等。看到这些名称先别晕,其实这些工具的使用方法很简单。不信?那么今天就来看看,如何通过相关系数分析,找出影响销量下降的原因。
第1步:在Excel表格中输入数据。例如你怀疑影响销量的原因可能有售价、客流量、促销折扣,但是不知道究竟哪个原因是罪魁祸首。
第2步:现在需要调出数据分析工具箱。如下图所示,单击【文件】菜单中 的【选项】选项。
第3步:在【加载项】菜单中选择【Excel加载项】,然后单击【转到】按钮。
第4步:选择【分析工具库】选项,单击【确定】按钮。此时就成功将分析工具添加到菜单栏中了。
第5步:单击【数据】选项卡下的【数据分析】按钮,这就是前面步骤中添加的数据分析工具库。
第6步:选择【相关系数】分析工具,单击【确定】按钮。
第7步:在【相关系数】对话框中设置数据区域。在【输入区域】中选择表格中的所有数据区域,分组方式为【逐列】,因为表格中,每一列为一组数据。选择【标志位于第一行】,这样分析结果中才会有标题字段。设置一个输出区域,例如选择G2单元格,表示要将输出结果放到G2单元格开头的单元格中。
第8步:此时就可以查看分析结果了。因为我们需要判断影响销量的因为,所以只需要在I列中,看销量与其他因素的相关系数值就可以了。负数表示负相关,正数表示正相关,正数正大和负数越小都表示相关系数很大。
例如在下图中,销量与促销折扣的相关程度是最大的,为-0.763,说明折扣是影响售价的最大因素。此外第二个因素是售价,为-0.3389。
虽然今天的案例比较简单,但是使用相关系数工具的思路却可以用到其他复杂的案例上。大家只要将各因素的数据列出来,使用相关系数分析,找到相关系数最大或最小的那个值就可以了。