医学统计学 第四章(定量资料的统计描述)

第一节 频数分布表与频数分布图

1、频数分布表

频数分布表

2、频数分布图

频数分布图

3、频数分布特征

  • 集中趋势(一组数据向一个位置聚集)
  • 离散趋势(一组数据的分散性或变异度)

4、频数分布类型

  • 对称型
  • 不对称型(偏数值大的一边,正偏态;反之,负偏态)

第二节、集中位置的描述

(1)均数
a. 均数计算
  • 直接法
  • 加权法( k1p1+k2p2+……knpn)/(k1+k2+......kn )
b. 特征
  • 各观察值与均数之和为0
  • 各观察值离均差平方和最小

两个特征表明均数是单峰对称分布观察值最理想的代表值,特别是正态分布或者近似正态分布,不适用于描述偏态分布资料的集中位置

(2) 几何均数(G)

对于正偏态分布,但经过对数变化后呈对称分布;或者观察值之间呈倍数关系或者近似倍数关系

a. 计算
  • 直接法


  • 加权法 (也需要取对数)


b.应用
  1. 适用于观察值间呈倍数或近似倍数关系的资料
  2. 适用于变量呈正偏态分布,对数变换后呈正态或近似正态
  3. 负偏态资料不宜用几何均数,用中位数

(3)中位数

a.从大到小最中间的数
b.应用

中位数不受极端值的影响,因此用于不对称分布类型的资料、两端无确切值或分布不明确的资料


第三节 离散程度的描述

常用指标:极差、四分位数间值、方差、标准差和变异系数

1、极差

最大减最小

2、四分位数间距

(1)百分位数

将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列。如,处于p%位置的值称第p百分位数,表示为Px。

3、方差

方差用来计算每一个变量(观察值)与总体均数之间的差异。为避免出现离均差总和为零,离均差平方和受样本含量的影响,统计学采用平均离均差平方和来描述变量的变异程度。总体方差计算公式:




实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式:




(n-1)为自由度,自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本数量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。采用自由度作为分母为了避免用样本方差估计总体方差时偏小。

4、标准差

总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度。

5、变异系数

当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同,直接使用标准差来进行比较不合适,此时就应当消除测量尺度和量纲的影响,从而引入变异系数(CV)来比较其离散程度。



第四节 正态分布及其应用

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),就是一种重要的连续随机变量的分布类型。


正态分布图

1、特征

正态分布曲线的密度函数


  • 正态曲线在横轴上方均数处最高
  • 正态分布以均数为中心左右对称
  • 有两个参数,位置参数 μ(均数) 和形态参数 σ (标准差)
    正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。
    P{|X-μ|<σ}=2Φ(1)-1=0.6826
    横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%。
    P{|X-μ|<2σ}=2Φ(2)-1=0.9544
    横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。
    P{|X-μ|<3σ}=2Φ(3)-1=0.9974
    由于“小概率事件”和假设检验的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

2、标准正态分布

均数为0,标准差为1


标准正态分布

3、应用

  • 估计总体变量值的频率分布
  • 制定参考值范围
  • 质量控制
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,029评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,238评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,576评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,214评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,324评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,392评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,416评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,196评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,631评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,919评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,090评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,767评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,410评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,090评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,328评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,952评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,979评论 2 351

推荐阅读更多精彩内容

  • 第一章 变量和图形 统计学:科学方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学; 归纳...
    凭栏听雨_t阅读 4,316评论 0 0
  • 最近在做薪酬绩效分析报告,借助Power pivot处理数据,便找了些数据分析的理论知识。真正做分析的时候,发现已...
    豌豆射手Dany阅读 6,246评论 0 2
  • [TOC] 思路框架 在描述统计中,正态分布的一组数据有两个最重要的特征,一个是如何集中的(均值$\mu$),另一...
    八般阅读 3,147评论 0 1
  • 一个内置的过程:接受——就像觉知、正念和幸福一样——无须刻意去努力。在过去几年间,听到过许多自助专家、教练和精神导...
    合一成长导师阅读 172评论 0 1
  • 姓名:张涛 部门岗位:进口部 【日精进打卡第121天】 【知~学习】 读宋史 【行~实践】 一、修身 跑步六公里 ...
    351a0809b14d阅读 105评论 0 0