第十二章数据分析与解释(Ⅰ)∶描述数据,置信区间,相关
●呈现研究结论
当数据分析完成后,我们必须用一个完整的结论来解释我们的发现,反驳对立的观点,并说明我们的结论是站得住脚的。
●计算机辅助的数据分析
a研究者主要使用计算机来完成数据的统计分析。
b使用计算机软件进行数据分析要求研究者对研究的设计和统计有清楚的认识。
●例证:一个实验研究的数据分析∶均数比较
第一阶段:了解数据
a数据分析的第一步是检查数据的整体特征,对数据进行必要的编辑,或者说“清理”。
b注意小心地检查数据中的错误,比如数据缺失、不可能的值(如超出了量表给定范围的值)以及极端值
c茎叶图可以有效地将一套数据的整体特征直观呈现出来,并有利于探测极端值。
d数字的、图形的或者言语陈述的方式都可以有效总结数据,但好的数据描述通常会三种方法都用上。
第二阶段∶概括数据
a计算集中趋势,包括平均数、中数和众数。衡量离中趋势和变异的重要指标是全距和标准差。
b平均数的标准误是理论抽样分布中平均数的标准差,它用于测量我们对总体平均数估计得究竟如何。
c效应大小是非常重要的测量指标,因为它们能够排除样本容量大小的影响,为自变量和因变量之间的关系强度提供信息。
d在对两个均数进行比较时,测量效应大小的一个重要指标是科恩d值。
第三阶段;用置信区间来判断数据所反映的意义
a要确认数据到底告诉我们什么,一个重要的途径是建立总体参数的置信区间,这些总体参数可能是一个平均数,也可能是两组平均数之间的差异。
●例证∶一个相关研究的数据分析
a当同一组人、事件、或物体的两个测量一起变化——也就是,当一个变量上的得分与另一个变量上的得分共变时,就存在相关。
第一阶段∶熟悉数据
第二阶段∶概括数据
a对相关性数据的主要描述统计是建立散点图以及计算相关系数。
b相关的程度可以从散点图上判断出来,各点的排布越接近一条直线,相关就越强。
c相关系数的取值分布是从-1.0(完全负相关)到+1.0(完全正相关);相关系数为 0表示两个变量之间没有关系。
第三阶段∶为相关构建一个置信区间
a我们可以建立一个置信区间来估计总体相关系数ρ,就像估计总体平均数μ一样。