统计学 -- 数据的来源

数据搜集方法.png

一.数据的直接来源

概念: 数据的直接来源也称为一手数据或原始数据,是指通过自己的调查或实验活动直
    接获得的一手数据,其收集方法主要有实验方法非实验方法

特点: 一手数据的时效性和相关性好,但收集成本较二手数据要高很多

1-1. 实验方法

实验方法的基本逻辑:

有意识地改变某个变量的情况,然后看另一个变量变化的情况,如果第二个变量随着第一个变量的变化而变化,就说明变量1对变量2有影响,即控制变量

统计在实验法中的作用:

  • 可以确定进行实验所需要的单位的个数,以保证实验可以达到统计显著的结果
  • 将统计的思想融入实验设计,可以使实验设计符合统计分析的标准
  • 统计提供了提供尽可能最有效地同时研究几个变量影响的方法
  • 在对实验数据进行分析时,根据研究的需要,统计可以提供最恰当的分析方法

1-2. 非实验方法

  数据直接来源的非实验方法就是抽样,其中抽样可以分为两类:概率抽样非概率抽样,其中概率抽样也区分为等概率抽样和不等概率抽样。
  为了不使篇幅过长,本文采用列表来表示常用的概率抽样方法、非概率抽样方法以及在抽样之后所用到的调查方法。

           常用的概率抽样方法

①. 简单随机抽样

  • 概念: 简单随机抽样是从包括总体N个单位的抽样框中随机地、一个个地抽取n个单
        位作为样本,每个单位的入样概率是相等的
  • 特点: 简单、直观,在抽样框完整时,可以直接从中抽取样本,由于抽取的概率相
        同,用样本统计量对目标量进行估计及计算估计量误差都比较方便
  • 局限性:
    • ⑴. 它要求将包含所有总体单位的名单作为抽样框,当N很大时,构造这样的抽样
         框不容易
    • ⑵. 这种方法抽出的单位很分散,给实施调查增加了困难
    • ⑶. 这种方法没有利用其他辅助信息以提高估计的效率

②. 分层抽样

  • 概念: 是将抽样范围按某种特征或某种规律划分为不同的层,然后从不同的层中独
        立、随机地抽取样本
  • 优点:
    • ⑴. 保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相
         近,可以提高估计的精度
    • ⑵. 这种方法在一定条件下为组织实施调查提供了方便;(当层是按行业或行政区
         划进行划分时)

③. 整群抽样

  • 概念: 将总体中若干个单位合并为群,抽样时直接抽取群,然后对中选群中的所有单
        位全部实施调查
  • 优点:
    • ⑴. 抽取样本时只需要群的抽样框,大大简化了编制抽样框的工作量
    • ⑵. 群通常由隶属于同一系统的单位所构成,调查地点相对集中,节省了调查费
         用,方便了调查的实施
  • 缺陷: 估计的精度较差

④. 系统抽样

  • 概念: 将总体中的所有单位按一定顺序排列,在规定的范围内随机抽取一个单位作为
        初始单位,然后按事先制定好的规则确定其他抽样单位
  • 优点:
    • ⑴. 操作简便
    • ⑵. 如果有辅助信息,对总体内的单位进行有组织的排列,可以有效地提高估计的
         精度
  • 缺点: 对估计量方差的估计比较困难

⑤. 多阶段抽样

  • 概念:先抽取群,但不是调查群内的所有单位,而是进一步抽样,从选中的群众抽取
       出若干个单位进行调查;(这种属于二阶段抽样)
  • 优点:
    • ⑴. 具有整群抽样的优点,保证了样本相对集中,节约了调查费用
    • ⑵. 不需要包含所有低阶段抽样单位的抽样框
    • ⑶. 由于实行再抽样,所以调查单位可以在更广的范围内展开


           常用的非概率抽样方法

①. 方便抽样

  • 概念: 指调查过程中,调查员依据方便的原则,自行确定作为样本的单位
  • 优点: 容易实施,调查成本低
  • 缺点: 样本的确定带有随意性,将调查结果推广到总体没有任何意义

②. 判断抽样

  • 概念: 指研究人员根据经验、判断和对研究对象的了解,有目的地选择一些单位作为
        样本。
  • 优点: 抽样成本较低、容易操作

③. 自愿样本

  • 概念: 指被调查者自愿参加,称为样本中的一份子,向调查人员提供相关信息;(如
        网上发问卷)

④. 滚雪球抽样

  • 概念:在滚雪球抽样中,首先选择一组调查单位,对齐实施调查之后,再请他们提供
        另外一些属于研究总体的调查对象,调查人员根据所提供的线索,继续进行调
        查;
  • 优点:
    • ⑴. 容易找到属于特定群体的被调查者,调查成本较低
    • ⑵. 适合用于对稀少群体的调查

⑤. 配额抽样

  • 概念: 首先将总体中的所有单位按一定的标志分为若干类,然后再每个类别中采用方
        便抽样或判断抽样的方式选取样本单位
  • 优点:
    • ⑴. 抽样操作简单,可以保证总体中不同类别的单位都能包括在所选取的样本中,
         使样本的结构和总体的结构类似
    • ⑵. 在配额抽样中,可以按单一变量控制,也可以按交叉变量控制(交叉变量配额
         控制可以保证样本的分布更为均匀)


            抽样后的调查方法

①. 自填式

  • 概念: 指在没有调查员协助的情况下由被调查者自己填写,完成调查问卷
  • 优点:
    • ⑴. 调查组织者对自填式方法的管理相对容易,只要把问卷正确送到被调查者手中
         即可
    • ⑵. 成本最低,增加样本量对调查费用的影响很小,所以可以进行大范围的调查
    • ⑶. 对被调查者有利,他们可以选择方便的时间填写,可以参考相关记录而不必依
         靠记忆回答
    • ⑷. 由于调查员不在场,因此可以在一定程度上减少被调查者回答敏感问题的压力
  • 缺点:
    • ⑴. 问卷的回收率低;(通常需要做很多跟踪回访工作以取得较高的回收率)
    • ⑵. 自填式方法不适合结构复杂的问卷
    • ⑶. 自填式方法对调查的内容有所局限
    • ⑷. 自填式方法的调查周期通常都比较长,调查人员需要对问卷的递送和回收方法
         进行仔细的研究和选择
    • ⑸. 对于数据搜集过程中出现的问题,一般难以及时采取调改措施

②. 面访式

  • 概念: 指现场调查员与被调查者面对面,调查者提问、被调查者回答这种调查方式
  • 优点:
    • ⑴. 提高了调查的回答率
    • ⑵. 提高了调查数据的质量
    • ⑶. 可以对识字率低的群体实施调查
    • ⑷. 由于调查问卷式由经过训练的调查员所控制的,所以在问卷设计中可以采用更
         多的技术手段,使得调查问题的组合更为科学、合理
    • ⑸. 在面访调查中,还可以借助其他调查工具以丰富调查内容
    • ⑹. 对数据搜集所花费的时间可以进行调节;(加快或减慢都可以)
  • 缺点:
    • ⑴. 调查的成本较高;(调查费用与样本量关系十分密切)
    • ⑵. 面访的方式的调查中对质量的控制有一定的难度,调查的数据质量与调查员的
         工作态度、责任心有直接关系
    • ⑶. 对于敏感问题,除非对调查员进行角色筛选,对调查员的访谈技巧进行专门的
         技术培训,否则在面对面的条件下,被调查者通常不会像自填式方法下那样放
         松

③. 电话式

  • 概念: 指调查人员通过打电话的方式向被调查者实施调查;
  • 优点:
    • ⑴. 速度快,能够在很短的时间内完成调查
    • ⑵. 特别适合样本单位十分分散的情况,数据搜集的成本低
    • ⑶. 电话调查对调查员也是安全的;(不需要去偏僻的地区)
    • ⑷. 电话调查中,对访问过程的控制较为容易,因为调查员的工作地点都在一起,
         调查遇到的问题可以得到及时处理和解决,调查督导对访问实施监听也很容易
  • 局限性:
    • ⑴. 在电话使用率不高的地区,电话调查会受到限制
    • ⑵. 使用电话进行访问的时间不能太长,人们不愿意通过电话进行冗长的交谈,在
         被访问者对调查内容不感兴趣时更是如此
    • ⑶. 电话调查所使用的问卷要简单
    • ⑷. 与面访式相比,电话调查在被访问者不愿意接受调查时要说服他们就更为困难

④. 观察式

  • 概念:通过直接观测的方法获取信息


二.数据的间接来源

概念: 数据的间接来源指的是数据是由别人通过调查或实验的方法搜集的,使用者只是
   找到它们并加以使用(从这种途径收集到的数据称为间接来源的数据)

来源: 间接数据来源包括两种,系统内部和系统外部。系统内部是指统计部门和各级政
   府部门公布的有关资料等,而系统外部指经营活动过程中的各种统计报表等

优缺点:

  • ①. 优点
    • ⑴. 搜集容易
    • ⑵. 采集数据的成本低,而且能很快得到
    • ⑶. 二手数据的作用比较广泛,除了分析所要研究的问题,这些资料还可以提供研
         究问题的背景,帮助研究者更好地定义问题,检验和回答某些假设和疑问,寻
         找研究问题的思路和途径
  • ②. 局限性
    • ⑴. 二手资料不是为特定的研究问题而产生的,所以在回答所研究的问题方面可能
         有欠缺;(因此,在使用二手资料前,对二手资料进行评估是有必要的)
    • ⑵. 针对性不够


      结束语.jpeg
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 弹指已十年,岁月催红颜。 回首不复返,怆然低声叹。 少年不知情,把酒尽言欢。 望空有悔意,奈何知错晚。 忆起往昔人...
    劉慧剛阅读 2,454评论 5 3
  • 当面向大海,我感受到人生如轻舟,随风漂流;当面向高山,我感受到生命如旅程,越挫越勇。不禁沉思:人活着,该以怎样的姿...
    Nb0WSw70阅读 1,706评论 0 0
  • 我是一名初二女孩子的妈妈,昨天老师因为孩子上课看手机让我去学校了,和老师交流后发现她不止是带手机这件事,还有...
    炫紫不迷茫阅读 3,823评论 6 49

友情链接更多精彩内容