在t检验的那篇文章里面,给到了两个样本对比差异的案例,假设我们要对比的样本不仅仅两个而是很多个,那么这时候,我们需要一个新的方法,就是方差分析,...
这一部分的内容是后续所有算法的基础的基础。就是我们常说的各种检验,例如:t检验,Z检验,F检验,卡方检验等等。这些检验目的是告诉我们可以接受原假...
去年从TC16回来后写过一篇《现场笔记-Tableau 产品规划路径 --some takeways from Tableau Conferen...
这篇文章介绍下简单线性回归的理解。 还是用一个例子来说明。不像在中国,在美国旅游我们会知道,凡是有人为你服务,我们都需要有一定小费的支出,小费的...
经常大家会人为p值等同于概率,然而p与概率彼此之间是有相关性,但是并不意味着两者等同。 首先,我们看下p值的概念:“A p-value is t...
数据内容为1990年加州人口普查中所收集的信息。具体内容包括:各个区域内的收入的中位数,人口数量,房龄中位数,家庭数,总共房间数,总共卧室数,经...
看到很多数据分析书籍里面谈及到主成分分析和因子分析,我们常常会发现两种分析方法有很多相似的地方,然而,两种方法却截然不同,在网上看到了一篇文章将...
误区1:只要将数据挖掘工具连接上数据库就能进行数据挖掘了 数据分析与数据挖掘本质是一个定义问题,分析问题,解决问题的过程。现实是,不存在能够机械...
笔者工作在一个乙方的公司,两年下来接触过很多的客户,大家对数据分析和挖掘都非的热情,然而数据分析与挖掘这件事情再深入去看,笔者会发现大家往往会走...