描述统计量数

一、母体与样本

母体:包含针对某一特定决策或调查的所有研究对象

样本:母体的子集

二、位置量数

提供了一个单数值的估计值,这个估计值以某种方式代表着数据集中的“中心”。包括:算术平均数、中位数、众数、中列数

算术平均数(平均值average):母体的平均值用μ来表示,Xˉ为样本均值

中位数(Median):数据从小到大排列时,规定中间数值的位置量数是中位数。

众数(mode.sngl):出现次数最多的那个观测值。

中列数:数据集中最大值与最小值之间的平均值。

三、离散量数

离散:数据的分散程度,也就是说,数据在数值上的分散(或者集中)。描述离散的统计学量数有:全距、方差、标准差

全距:一个数据集内最大数据与最小数据之差。(max-min)

四分位距(IRQ,或者中点分配):第一个四分位数与第三个四分位数之差,Q3-Q1,通常称为四分位距(IQR),也称为中点分配。

方差(Variance):在概率论和统计学中,一个随机变量的方差描述的是它的离散程度,也就是该变量离其期望值的距离。一个实随机变量的方差也称为它的二阶矩或二阶中心动差,恰巧也是它的二阶累积量。

方差越大,意味着以平均值为中心而扩散的数据越多,在观察值中也会出现更多的变异。

母体方差的计算公式为:    (其中Xi是第i项,N是母体中的观察数目,)

样本方差的计算公式为:

标准差:方差的平方根。

母体方差的计算公式为(STDEV.P):

样本方差的计算公式为(STDEV.S):

切比雪夫定理:任意一个数据集中,位于其平均数m个标准差范围内的比例(或部分)总是至少为1-1/㎡,其中m为大于1的任意正数。因此当m=2时,,至少有3/4(或75%)的数据位于平均数2个标准差范围内。当m=3时,至少有8/9(或89%)的数据位于平均数3个标准差范围内。这样的话,我们只要运用计算出来的平均值和标准差,便可以用这些数值来从根本上理解数据集的偏差。

经验规则:(s至标准差)

1,大约68%的观察值将位于距离平均值的1个标准差范围内,或者介于“x拔-s”或“x拔+s”之间。

2,大约95%的观察值将位于距离平均值的2个标准差范围内,或者介于“x拔-2s”或“x拔+2s”之间。

3,大约99.7%的观察值将位于距离平均值的3个标准差范围内,或者介于“x拔-3s”或“x拔+3s”之间。

工序能力指数(cp):表示工序能力对设计的产品规范的保证程度。评价加工工艺系统满足加工技术要求的程度。

cp=(规格上限-规格下限)\总偏差

标准化值(z~分数)(standardize):提供了观察值与平均均值之间的相对的距离测量指标,不受测量单位影响。数据集中的第i个观察值的z分数,公式:

Zi=(Xi-X拔)/s

变异系数(cv):提供了数据中离散程度的相对测量,CV=标准差/平均差

四、形态量数:

偏度:描述了缺乏对称的数据的分布形态

正偏度:分布形态向右侧“缩小”

负偏度:分布形态向左侧“缩小”

偏度系数(cs):测量观察值围绕平均值的不对称程度。

单峰:只有一个峰的直方图成为双峰

双峰:有两个峰的直方图称为双峰

峰度:直方图的尖峰度(即高而窄的形态)或平坦度(即矮而平坦的形态)

峰度系数(ck):测量母体的峰度

公式:

六、分类数据的描述统计量数

比例:正规的统计量数,用p表示。

八、关联量数

协方差:测量两个变量X与Y之间线性关联的量数。

相关:测量X与Y两个变量之间线性关联的量数,它并不取决于测量的单位,相关是通过相关系数来测量的。

相关系数(皮尔森积距相关系数):协方差除以标准差之积。

样本相关系数

九、极端值

极端值:数据中特别大或特别小的值,它们可以使我们从统计分析中获得的结果显著改变。

十、商业决策中的统计思维

统计思维:是一种学习的理念和不断优化的行动,它基于以下这些原因:

1、所有工作都在相互关联的流程组成的一个系统中发生。2、在所有过程中所有,偏差始终存在。3、更优异的绩效,来自于理解和减少偏差。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容

  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,688评论 0 3
  • 基本概念 统计是对数据进行收集、分析、展示和解读的科学和艺术,这句话听起来很高深,但其实也没必要非要把统计想得过于...
    拓季阅读 10,813评论 0 6
  • 2017/元/1至2017/3/11日这100天实践金刚智慧种子计划如下: 我的财富目标是:月收入财富增长为3倍!...
    钱好天德高照福星护守阅读 169评论 0 0
  • 说出自己的要求有时是件很难的事,我最近深有体会。一个月前我的儿子出生了,这是我们的第一个孩子,我和妻子既激动又高兴...
    拾玥的十月阅读 370评论 0 1
  • 首先我已一模板为例,请看我的实例截图: 然后选中正文,右击正文弹出新样式,如图所示: 后来弹出这个东西: 然后选择...
    养柱阅读 2,481评论 0 0