统计学

变量的分类

分类变量,是说明事物类别的一个名称,取值是分类数据

顺序变量,是说明事物有序类别的一个名称,取值是顺序数据

数值型变量,是说明事物数字特征的一个名称,取值是数值型数据。

数据分布的特征可以从三个方面进行测度和描述:

集中趋势:反映各数据向中心值靠拢或聚集的程度

离散程度:反映各数据远离其中心值的趋势

分布的形状:反映数据分布的偏态和峰态

集中趋势的度量

分类数据:众数

顺序数据:中位数和分位数

数值型数据:平均数,包括简单平均数、加权平均数、 几何平均数(是n个变量值乘积的n次方根。用G表示实际应用中,主要计算现象的平均增长率)

离散程度的度量

根据数据性的不同主要有异众比率、四分位差、方差、标准差。此外还有极差、平均差以及测度相对离散程度的离散系数。

分类数据:异众比率(非众数组的频数占总频数的比例)

顺序数据:四分位差(=上四分位数-下四分位数,反映了中间50%的数据的离散程度,值越小说明中间的数据越集中)

数值型数据:方差和标准差,还有极差和平均差、

极差(全距):一组数据的最大值与最小值之差

平均差(平均绝对离差)::各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确的反映一组数据的离散程度。值越小数据的离散程度越小。

(离差:单项数值与平均值之间的差)

方差和标准差:实际问题中更多使用标准差,方差的平方根称为标准差。方差是各变量值与其平均数离差平方的平均数。它在数学的方法上消去离差的正负号,然后再进行平均。能较好的反映出数据的离散程度,是应用最广的离散程度测度值。

样本方差:自由度为样本个数-1(n-1)

相对位置的度量:

a.标准分数(标准化值或者Z分数):变量值与其平均数的离差除以标准差的值。标准分数给出了一组数据中各数据的相对位置,标准分数=-1.5即该数据比平均数低1.5个标准差。

标准分数具有平均数为0,标准差为1的特性。实际上Z分数只是将原始数据进行了线性变换,没有改变一个数据在该组数据中的位置,也没有改变该组数据的分布形状,只是将该组数据变为平均数为0,标准差为1.

b.经验法则:

约有68%的数据在平均数±1个标准差的范围之内

约有95%的数据在平均数±2个标准差的范围之内

约有99%的数据在平均数±3个标准差的范围之内

在±3个标准差的范围之外的数据,称为离群点。

c.切比雪夫不等式

经验法则适用于对称分布数据,而切比雪夫不等式对任何分布形态的数据都适用

切比雪夫不等式提供的是下界,也就是所占比例至少是多少

对于任意分布形态的数据,至少有(1-1/k^2)的数据落在±k个标准差之内(k为大于1的任意值,不一定是整数)

k=2,至少有75%的数据在平均数±2个标准差的范围之内

k=3,至少有89%的数据在平均数±3个标准差的范围之内

k=4,至少有94%的数据在平均数±4个标准差的范围之内

离散系数(变异系数):

为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。

离散系数主要用于比较不同样本数据的离散程度。是一组数据的标准差与其相应的平均数之比。

偏态与峰态的度量

偏态和峰态是对分布形状的测度:数据分布的形状是否对称,偏斜程度,扁平程度。

偏态及其测度:

对数据分布对称性的测度,测度偏态的统计量是偏态系数,记为SK。

根据分组数据计算偏态系数,可采用离差三次方的平均数再除以标准差的三次方。除以s^3这是为了将偏态系数转换为相对数。

SK=0,数据对称分布。

SK>1||SK<-1,高度偏态分布。

0.5<SK<1||-1<SK<-0.5,中等偏态分布。

峰态及其测度:

对数据分布平峰或者尖峰程度的测度,测度峰态的统计量是峰态系数,记为K。

根据分组数据计算偏态系数,可采用离差四次方的平均数除以标准差的四次方。除以s^4这是为了将偏态系数转换为相对数。

K=0,正态分布。

K>0,尖峰分布,数据分布更集中。

K<0,平峰分布,数据分布更分散。


数据分布特征和描述统计量

一组数据的分布特征可以从哪几个方面进行测度?

可以从数据分布的集中趋势、离散程度和分布的偏态与峰态三个方面进行测量。集中趋势反映了各数据向其中心支靠拢或聚集的程度;离散程度反映了各数据原理其中心值的趋势;偏态与峰态反映了数据分布的图像形状。

简述众数、中位数和平均数的特点和应用场合。

众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数只有在数据量较多时才有意义。主要适合作为分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值,不受极端值影响,当数据分布的偏斜较大时,可以使用中位数。主要适合作为顺序数据的集中趋势测度值。

平均数是针对数值型数据计算的,而且利用了全部数据信息。当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选平均数作为集中趋势的代表值。但平均数的主要缺点是易受极端值的影响;对于偏态分布的数据,平均数的代表性较差。

简述异众比率、四分位差、方差或标准差的应用场合。

异众比率主要用于测量分类数据的离散程度;四分位差主要用于测量顺序数据的离散程度;方差或标准差主要用于测量数值型数据的离散程度。

标准分数有哪些用途?

标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据是否有离群数据。

为什么要计算离散系数?

方差和标准差是反映数据离散程度的绝对值,一方面其数值大小受原变量值本身水平高低的影响;另一方面,他们与原变量的计量单位相同,采用不同计量单位的变量值,其离散程度的测度值也就不同。

测度数据分布形状的统计量有哪些?

对于分布形状的测度有偏态和峰态。测度偏态的统计量是偏态系数;测度峰态的统计量是峰态系数。


抛掷一颗筛骰子,出现的点数是一个离散型随机变量,点数的概率分布如下所示


点数的概率分布

E(x) = 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6=3.5,即各种可能点数的均值为3.5

D(x) = (1-3.5)^2*1/6+(2-3.5)^2*1/6+(3-3.5)^2*1/6+(4-3.5)^2*1/6+(5-3.5)^2*1/6+(6-3.5)^2*1/6 = 2.9167

标准差σ = 1.7078 ,即每次投掷的点数与平均点数3.5平均相距1.7078点。

离散系数V不同期望的总体之间的离中趋势,V=σ/E(x)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容