一、统 计的三种含义:统计数据,统计活动和统计学。
二、统计数据,是我们统计学的研究对象,它通过统计指标的方式,按统计方法收集、整理和分析,最后以统计年鉴、统计报告、统计图表等方式加以展现,而这些统计数据,它需要借助统计调查、统计整理和统计分析等手段来获得。所以统计调查、统计整理和统计分析的整个过程我们称之为统计活动。统计数据是统计活动的成果,统计活动是获得统计数据的过程。统计学是关于如何收集、整理和分析统计数据的科学。Q(可否总结为:统计学→统计活动→统计数据→分析数据→决策?)它是收集和分析数据的科学与艺术。它通过对数据进行收集、整理、展示、分析和解释,以帮助人们更有效地进行决策的科学。它的构成要素有:问题、数据和方法。方法围绕着数据转,数据跟着问题走。(问题是源头,也是归宿)
三、统计数据在狭义上指可计算的数值;在广义上指一切可处理和分析的事实,包括数值、图表、文字、符号、声音、图像、视频等。
它有如下几种划分角度☟
(一)按测量尺度划分为:1.定性数据(只能用文字和数字代码表现事物属性特征的数据):按其能否排序分为:①定类数据:对事物分类的结果,如性别、省份;②定序数据:对事物排序的结果,如职称、满意度。定序数据包含了定类数据的功能。2.定量数据(用数值表现事物数量特征的数据):根据是否存在绝对零点(:零代表没有)可以分为:①定距数据:能反映数量的差异,但不存现在绝对零点,如温度、利润;②定比数据:能进行数量对比,存在绝对零点,如身高、体重。
(二)按数据来源分为:1.实验数据(常在自然科学领域),如生物实验、化学实验;2.观测数据(常在社会科学领域),用统计调查的方式来获得数据。(三)按时空状态分为:1.时序数据:是把同一个指标的数值按时间先后顺序加以排列所形成的数据。2.截面数据:是指在相同的时间状态下,不同空间的同一指标的数值排列而成。二者结合在一起成为平行数据(可用在模型分析)(四)按表现形式不同可分为:1.绝对数(反应现象绝对总量、绝对规模等方面的特征的一些数据如包括总人口数、总销售额等等),2.平均数(反映某个变量分布的一般水平的数据,如平均工资、考试的平均分数等等。当然具体的平均数怎么计算,它又可以分为数值平均数和未知平均数两大类),3.相对数(反映现象内在的一种比例关系或者对比关系或者数量关系的统计数据,如说人口性别比、某类人口所占的比重、人口密度等等。具体来讲相对数,它又可以分为结构相对数、比例相对数、比较相对数、动态相对数、强度相对数和计划完成程度相对数等等)。
(五)在大数据背景下,我们可以按数据节构把统计数据分为结构化数据和非结构化数据1.结构化数据:是能够用二维表逻辑来表现的数据,也可以理解为我们常用的能够进行加减乘除运算的统计数据,它的特征是可计数、可计量、可计算。2.非结构化数据:难以用二维表逻辑来表现的数据,经常见的有各种视频、语音、图像、符号、网页等等。
四、统计数据的研究方法
1.大量观察法,它是统计调查的基本方法。它的本意是我们为了统计数据,需要对调查对象足够多的个体进行观测、调查以消除偶然因素造成的种种不确定性,使得获得的数据能够说明事物的特征。
2.统计分组法,它是把研究对象按照一定的标志加以分组,以了解总体内在的结构。传统的统计分组法,还有现代的判别分析,聚类分析法等这些分组,现在都能够结合一起使用。统计分组的最主要作用就是能够体现总体的内在构成以及它的统计分析所需要的各种指标的确定和计算 。
3.是综合指标法,它是统计学最主要的方法之一,也就是用统计指标来体现对象的数量特征,亦即统计数据背后的本质特征的概括。上文的绝对数,它的依据是总量指标;相对数,它的依据就是相对指标;平均数它的依据就是平均指标。
4.统计推断法,它是用样本去推断总体。因为我们有时候难以对总体进行全面的调查,只能从中获取随机样本,然后用样本的特征去推断总体的特征,包括抽样估计和假设检验等等。
5.统计模型法,它在各种统计分析法当中得以广泛使用,目的是为了能够通过适当的统计模型去研究不同现象不同变量之间的内在联系的关系,特别是因果关系。常用的统计模型有线性模型、非线性模型;还有一元模型,多元模型。