关于卫生统计学
Pierre Charles Alexander Louis
循证医学奠基人 放血疗法的评价
Galton Sir Francis Galton
第一位定量遗传学家 最早利用量表 最早发明回归直线和相关分析
Karl Pearson
现代统计学之父 开设统计学理论高级课程 创办第一份统计学杂志
Ronald A. Fisher
首创随机对照实验 提出对付误差的三原则:对照 随机化 适当组织(重复)
几个重要概念
总体:大同小异的对象全体
目标总体:试图下结论的某个总体。
研究总体:资料来源的较小总体。
注:就研究总体下结论未必适用于目标总体。
抽样:从研究总体中抽取部分个体。
样本:抽取的部分个体。
数据:观察所得到的资料。
信息:数据分析的产物。
推断:数据-信息-知识
同质与变异:共性与个体差异
变量:定性变量 定量变量
因果与联系:联系不等于因果
频率分布表与频率分布图
定义:变量值个数较多时,对各变量值出现的频率列表即为频率分布表,它的图形表示即为频率分布图。
资料的分布类型:
对称分布:频率分布图关于平均数对称。
正偏锋分布:数据集中在平均数右侧
左偏锋分布:数据集中左侧
分布特征:集中趋势 离散趋势
定量资料统计描述
描述集中趋势的统计指标
算术均数:简称均数。适合描述对称分布资料的集中位置。有直接法和频率分布表法。
几何均数:适用于观察原始值不对称分布或观察值范围跨越多个观察值的资料但经对数转换后呈对称分布的变量。
中位数:可适用于各种分布的定量资料,特别是偏锋分布。
众数:出现次数最多的数值。
描述变异程度统计指标
极差:最大值减最小值,不够稳定。
四分位数间距:P75-P25 包含50%个体 值越大变异越大
注:常把中位数和四分位数间距结合,描述变量的平均水平和变异水平。
方差:方差越大,变异越大。
标准差:适用于对称分布,方差的算数平方根。
注:对于对称分布,常用平均数和标准差描述资料的集中和离散趋势。
变异系数:单位不同变量间变异程度的比较。均数差别较大时,变异程度比较。
描述分布形态统计指标
偏度系数:0对称分布,正值正偏态,负值负偏态。
峰度系数:正态分布系数为零,正值峰尖峭,负值峰平阔。
统计图
直方图:描述连续型定量变量的频率分布。
累计频率分布图:描述连续型变量的累计频率分布。
箱式图:综合描述定量变量的平均水平和变异程度还可显示数据的离群值和极端值。
直条图:用等宽直条的高度表示相互独立的各项指标数量的大小。可描述离散型定量变量和定性变量的频率分布。