1.1 SAS初步印象
SAS全称“Statistical Analysis System”,不仅仅是一个软件,而且是一个包含各种模块的系统。
- 常见的几个SAS模块如下:
Base SAS:数据管理和描述模块;
SAS/STAT:统计分析模块;
SAS/GRAPH:绘图模块;
SAS/ETS:计量经济学和时间序列分析的模块;
SAS/QC:质量控制模块;
SAS/EM:数据挖掘模块;
SAS/GIS:地理信息系统模块;
SAS/GENETICS:遗传分析模块;
- SAS程序的基本构成
如上图所示,所有的SAS程序都由两部分构成:数据步+程序步,这两部分分别由data和proc开始,最后由run结束,颜色均为深蓝,代表SAS固定语句。
1.2 如何在SAS中输入数据
- 方式1:
在编辑器窗口直接建立数据集,这种方式由3句话构成:data、input和cards,语句的基本格式如下:
数据集名;
#空格隔开,数据集名只能由英文、数字和下划线组成;
变量1 变量2 ......;#空格分隔
;#把cards换为datalines也可以
数据
;#数据输入结束后的分号必须另起一行写
通过这种方式建立的数据集默认保存在“SAS资源管理器->逻辑库->WORK”中,该文件夹为临时数据集,一旦关闭SAS,该文件夹就会自动清空。
SAS工作环境中有一个资源管理器,其中的逻辑库就是存放SAS文件的地方。
- 方案2:
将数据集建立在非WORK文件夹下,这样的数据集一般被称为永久数据集,只须在数据集名字前加上逻辑库中的相应文件夹(非WORK)前缀即可,如:
sasuser.first;
#将数据集first放在sasuser文件夹下
gender age;
;
1 30
0 24
;
逻辑库中虽然有几个默认的文件夹,但是我们还是可以自己建立文件夹的,只须一句话:
逻辑库文件夹名 硬盘的文件夹路径和名称 ;
对于自己建立的逻辑库,在调用之前还需要用libname语句把逻辑库与文件夹建立关联,如:
fgs "g:\excel";
;
run;
- 方法3:
还有一种非常简单的建立永久数据集的方式,就是直接用data语句指定一个路径和SAS数据集名,如:
"g:\excel\first";
gender age;
;
1 30
0 24
;
通过这种方式建立的数据集,调用方式为:
data="g:\excel\first";
run;
1.3 如何导入数据
从外部导入数据其实最常用的方法就是直接在SAS的菜单栏里操作,位置在“文件 -> 导入数据”中,然后按照提示进行设置即可,我想记录的是其背后的代码,举例说明:
其中:
OUT:指定数据导入到SAS中的文件夹和数据集名;
DATAFILE:准备导入的数据在电脑上的路径;
DBMS:选择数据库类型,REPLACE表示覆盖SAS同名数据集;
RANGE:选择导入数据所在的sheet,range下面的5行是默认的options选项;