常用数据挖掘工具
- SAS,全称STATISTICAL ANALYSIS SYSTEM,统计分析系统;
- SPSS,全称Statistical Product and Service Solutions,统计产品与服务解决方案;
- KNIME,全称Konstanz Information Miner,数据挖掘软件平台
常用挖掘算法
- 贝叶斯
- 聚类
- 神经网络
- 决策树
- 关联分析
- 线性回归
- 逻辑回归
- 综合评价
常用算法
BI进程
从初级到高级,统计 > 分析 > 挖掘,其中统计、分析这两项已基本普及。BI进程中偏重于挖掘,而挖掘很大程度属于人工智能方向。
统计、分析与挖掘的区别
- 例如,企业的销售额下降了,那统计上要做的事,就是过去下降了多少。比如过去一周销售额有多少,对比前一周销售额下降了多少,这就是基本的统计;
- 销售额下降了这么多,到底是哪些产品造成了下降?这是分析;
- 造成这些产品销售额下降的因素是什么?这就是相关性的问题,然后未来可能下降,还是不可能下降呢?这就是回归,可以做线性回归,也可以做逻辑回归,即所谓的预测,在贝叶斯里面也可以做。
注意:这些过程都依赖于销售的指标体系和维度体系