在各类专业的论文写作中,我们常常要对获取的数据进行统计建模,从而佐证文章中提到的假设和分析,这时,就需要用到各式各样的统计软件了。
那么,常用的统计软件都有哪些呢?这些软件又分别有什么特点呢?只有弄清了这两个问题的答案,大家才好在不同的软件中选择出最适合你的那一个。
今天,我们就来向大家简单介绍一下论文中常常会用到的统计软件,它们分别是SPSS、EViews、R、Stata、Matlab以及SAS。
SPSS
SPSS是英文Statistical package for the social science 的缩写, 20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部,2009年7月28日,IBM公司宣布将用12亿美元现金收购统计分析软件提供商SPSS公司。如今SPSS的最新版本为25,而且更名为IBM SPSS Statistics。
SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形、表格较有方便,输出结果比较直观。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以根据数据绘制各种图形。
SPSS操作界面
优点:SPSS最大的优点就是其操作简单,基本的操作使用软件提供的选项即可,相较于其他需要输入较复杂指令或编程的统计软件学习成本最低。如果用到的是较为传统典型的统计学模型,推荐使用SPSS。
收费:是
学习难度:简单
自由度:较差
EViews
EViews是Econometrics Views的缩写,通常称为计量经济学软件包,是美国QMS公司推出的基于Windows平台的专门从事数据分析、回归分析和预测的统计软件。
EViews处理的基本数据对象是时间序列,每个序列有一个名称,只要提及序列的名称就可以对序列中所有的观察值进行操作。Eviews使用图形交互式用户界面,拥有统计分析、线性回归分析、非线性单方程模型、联立方程模型、动态回归模型、分布滞后模型、VAR模型、ARCH/GARCH模型、离散选择模型、时间序列模型、编程与模拟等分析模块。
EViews操作界面
优点:Eviews在计量软件中的操作也相对简单,大部分功能可以通过按键与简单的输入完成,兼顾了计量经济领域模型的复杂性与软件操作的难度,对于时间序列的建模尤其适用。
收费:是
学习难度:较简单
自由度:较差
R软件
R软件是一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发,现在由“R开发核心团队”负责开发。
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。
R软件操作界面
优点:R软件最大的优点是它自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。另外,R软件还有一个重要的优点就是这是一款免费软件。
收费:否
学习难度:较难
自由度:高
Stata
Stata 是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。
Stata是我国计量经济学界最常用的软件,能够实现绝大部分的计量分析模型,Stata的统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。除此之外,Stata有着众多的外部命令,从而能够使其具有更加丰富的功能。
Stata操作界面
优点:Stata是最适合计量经济学分析的软件,绝大多数计量模型都可以使用Stata完美的实现,在统计分析能力方面Stata远远超过了SPSS,在许多方面也超过了SAS。由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此计算速度极快。同时,Stata绘制的图形也较为精美。
收费:是
学习难度:适中
自由度:较高
Matlab
Matlab是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括Matlab和Simulink两大部分。
Matlab在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。
Matlab操作界面
优点:Matlab具有高效的数值计算及符号计算功能,具有完备的图形处理功能,实现计算结果和编程的可视化。同时还具备功能丰富的应用工具箱(如信号处理工具箱、通信工具箱等) ,为用户提供了大量方便实用的处理工具。
收费:是
学习难度:难
自由度:较高
SAS
SAS(全称STATISTICAL ANALYSIS SYSTEM,简称SAS)是由美国北卡罗来纳州立大学1966年开发的统计分析软件。1976年SAS软件研究所成立,开始进行SAS系统的维护、开发、销售和培训工作。期间经历了许多版本,并经过多年来的完善和发展,SAS系统在国际上已被誉为统计分析的标准软件,在各个领域得到广泛应用。
SAS由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。
SAS
操作界面
优点:SAS使用简便,操作灵活,SAS以一个通用的数据(DATA)步产生数据集,尔后以不同的过程调用完成各种数据分析。其编程语句简洁,短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。
收费:是
学习难度:适中
自由度:较高