常常看到有朋友在票圈吐槽:还没正儿八经做毕设,就先体会到了研究生的苦!
确实,如今做研究僧的早就不指望着能发表什么鸿篇巨制,能安安稳稳的佛系走完学术三年就已经是谢天谢地!然而即使定如老僧,deadline临头,该写的论文一篇也逃不了,该分析的数据一个都不会少。毕竟这年头出家人也得期末考试的!!!
所以说看破红尘什么的在论文面前都是不存在的~
那么既然无法逃避,唯一的解决方法只能咬牙硬扛咯,好在这篇文章可以帮助学术小白快速掌握数据分析的思维,让你不再为数据所累~安心享受学术之旅
诚如大家所知,玩转SPSS几乎是每位科研狗必备技能包之一
作为一款听起来高大上的数据分析软件,SPSS的学习门槛其实并不高,它就像EXCEL一样是一款只要稍加学习就可以掌握大部分基础操作的“傻瓜式”工具。
但在使用的过程中,我们会发现,为什么用起SPSS我还是像个“新手”一样,完全不知道要下一步要干什么??怎么选分析方法??得到的结果得分是啥意思???
你是否也有过上述的疑问?即使学习过统计学相关课程,但在具体数据进行分析时依然一脸懵X?
正确的学习姿势
其实数据分析并不难懂,只要找到正确的学习方法,培养良好的数据分析思维就可以很快上手了。当然如果操作SPSS还嫌复杂,可以使用SPSSAU(网页版SPSS)简单拖拽,即可得到智能化分析结果。
在学习数据分析的过程中,建议大家按照以下四个模块进行学习:
一是数据分析思维的培养。二是数据间的几类关系情况。三是数据分析方法的选择。四是数据研究的撰写等。
这篇文章主要为大家详细介绍一下第一部分即数据分析思维的培养,其他部分的知识将在以后一一分享给大家。
核心思想:(1)尊重数据 (2)数据类型的识别
第一步:尊重数据。
尊重数据就是尊重客观事实,数据有时也许片面,但它却诚实而不带情绪,因此可以排除一切认为的偏好因素,也因此让我们更接近真相。作为数据研究人员,首先需要确保的是对数据的敬仰,错误的数据绝对无法容忍,否则永远不会得出科学的结论。原始数据代表的意义,数据自身带来的属性等,均应该逐一确认。
第二步:数据类型的识别。
数据类型是一切研究的基石,也是数据研究思维最基本且最关键的思维。确认数据的真实准确性后,即完成数据清理后,可对数据类型进行区分,一切数据均可分为两种类型,包括定性数据和定量数据。
那么何为定性数据?何又为定量数据呢?
一句话解释就是定性数据,数字大小代表分类,通常使用百分比汇总,无法计算平均值。比如性别,专业。性别仅为男和女,使用数字1和数字2表示,可以分别计算男和女的比例,但是不能算个平均分为1.2,得出性别平均为1.2这样的分析。
定量数据,数字大小可以进行量化,通常使用平均值表示。比如年龄,身高,体重,满意度等。可以计算平均年龄,但通常不分析每个年龄数字的选择百分比。
另外还有一类数据,既可以计算百分比,也可以计算平均值,比如问卷研究中的满意度,数字1代表非常不满意,数字2代表比较不满意,数字3代表中立,数字4代表比较满意,数字5代表非常满意。这类数据可以计算各项的百分比,也可以计算平均值。具体此类数据如何应用,主要是结合实际情况来决定,但通常来说,如果可以看作为定量数据,就按照定量数据情况进行即可。
案例分析
很容易理解吧!那么举个栗子
分析:血型之间不存在大小关系,并且可以计算百分比,因此属于定性数据
如要进一步探究不同血型对急慢性白血病影响的差异可选择适合分析定性数据×定性数据的卡方检验。
·SPSSAU操作截图
掌握了数据类型的鉴别,也可直接在SPSSAU进行卡方检验分析
表8 不同肥料A与不同苗床B对落叶松苗高影响的测定结果
分析:苗高类似于身高,数字大小之间存在可比性,所以可看作是定量数据
总结
正确识别数据类型是一切研究的基石,也是数据研究思维最基本且最关键的思维。数据识别并不难但不可大意,因小失大。