【社会统计学】2 单变量分布

抓紧复习的👣,单变量分布的一些统计方法

简化单变量的分布有哪些常用技术?

测量层次 统计表 统计图
定类变量 频次表、百分比表 条形图、圆瓣图
定序变量 累计频次表、累计百分比表 条形图、累计图*
定距/定比变量 组距式统计表 直方图、折线图

章节思维导图如下:

图1:单变量分布.png

  1. 单变量的描述统计
    • 单变量分析:仅对单一变量进行描述及推断
    • 变量分布:变量各个取值出现的次数或频率
    • 描述统计:对总体或样本的分布特征进行概括,描述意味着简化
    • 举例:毕业生的毕业出路;小鲜肉是否可以提高票房;中国单身成年的是否男多女少;老夫少妻是否更加普遍;中国人和美国人谁的幸福感更高;城市化过程中,新市民的收入是否上升
    • 变量的测量层次:定类、定序、定距/定比
    • 统计方法的选择:依据变量的测量层次,适用于较低测量层次的方法亦可以适用于较高测量层次

  1. 制表规范
    • 表号:编号
    • 表头:标题、时间、地点
    • 标识行:第一列为变量名称;第二列为对应的数据说明(表明单位,也可以放在表头)
    • 主体行:注意第一列为变量的值标签
    • 合计:百分比允许出现99.9%和100.1%同时需要给出(样本量)
    • 整体风格:三线表,两边不封口

  1. 定类变量
    • 指标
      • 频次分布:又称频数分布,用f表示。表明变量的每个取值在样本中出现的次数。例如婚姻状态
      • 百分比分布:用p表示,计算公式为 频数/样本量*100% 离婚率是千分之几,犯罪率是万分之几
      • 比值是部分与部分之间的关系;比例是部分与整体的关系;我的胜算是你的三成,这里是比例
    • 统计表
      • 频次表
        • 用频次信息做表,因受总数的影响,通常说明不了问题
      • 百分比表
        • 用百分比信息做表,更加直观,应用比频次表广
        • 注:合计是否为100%可以进行检测计算 需要标注基数(52943),方便与频次表转换
    • 统计图
      • 条形图
        • 长方形的长度表示频次或百分比
        • 注:坐标轴单位,视觉陷阱;如:每日新增确诊人数统计图
      • 圆瓣图
        • 又叫饼图,把一个圆形平面按照数值的比例分割。360°*所占比例即为角度
        • 需要表明基数

  1. 定序变量
    • 适用于定类变量的方法一样适用于定序变量
    • 累计频次表
      • 向上累加 cf↑ :向排序高的方向累加
      • 向下累加 cf↓ :向排序低的方向累加
      • 目的是获取小于等于某值的次数总和(向上累加);大于等于某值得次数总和(向下累加)
    • 累计百分比表
      • 向上累加 c%↑
      • 向下累加 c%↓
    • 累计图
      • 向上累计图:如每日累计新增确诊人数
      • 向下累计图

5.定距/定比变量

  • 适用于定类、定序的方法同样也适用于定距或定比层次的变量
  • 组距式统计表:将值分为若干组,计算每组的频次或百分比
    • 组数:分组的个数,太多太少都可能看不出规律
    • 等距分组&不等距分组
    • 组限:包括上限和下限
      • 标明组界:又称标示组限,用于统计表上标注
      • 真实组界
        • 真实下界=标明下界-0.5
        • 真实上界=标明上界+0.5
      • 组距:真实上界-真实下界
      • 组中心值:真实上界+真实下界/2
  • 直方图
    • 分类
      • 频率密度(相对频次密度)&频次密度
      • 等距分组&不等距分组
    • 频次密度:频数/组距
    • 频率密度:频率/组距
    • 性质
      • 横坐标宽度表示组距
      • 纵坐标高度表示频次密度或频率密度
      • 各个矩形相连排列,其实就是概率分布
  • 折线图
    • 直方图中矩形中点连线得来
    • 更易于看出趋势
    • 组距无限小时,就是概率密度函数
    • J形曲线&U形曲线
    • 正态分布&偏态分布(右偏分布峰在左)

This\ is\ the\ end\ !

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355

推荐阅读更多精彩内容