首先说明一下,我是个SAS小白,写文章只是为了督促自己学习,并不是SAS专家写经验帖和教程,所以疏漏在所难免。我觉得和人分享学习的知识是促进学习的一种方式,所以才写文章分享。
内容参考书籍:《The Little SAS Book》中文版
原始数据来源和位置
既然要使用SAS分析数据,那么第一步是要将数据导入到SAS中,要导入数据到SAS程序中,首先需要明确原始数据的来源或者位置。以下是几种常见的SAS数据集的来源。
- 直接在SAS中手动的输入数据
DATA TEST;
INPUT NAME $ GENDER $ AGE HEIGHT;
CARDS;
Tom M 15 167
Jack M 18 179
Lily F 18 160
David M 17 169
;
RUN;
这是一个在SAS程序中直接输入数据的例子,使用CARDS
语句指定数据的位置,在SAS程序中的数据是程序的一部分,被称为内部数据。CARDS
语句可以使用DATALINES
语句替换,不过需要注意的是,两者都位于DATA步的最后。
- 从外部原始数据文件中导入
DATA test;
INFILE "d:\Mydata\test.dat";
/*需要注意,在不同系统中路径书写方式略有不同*/
INPUT NAME $ GENDER $ AGE HEIGHT;
RUN;
外部数据文件的位置使用INFILE
语句进行指定,需要注意的是,INFILE
语句必须位于INPUT
语句之前。
- 转换或者直接导入其它软件中的数据为SAS数据集
使用SAS/ACCESS等产品或者Base SAS的一些工具从数据库或者EXCEl等外部软件中进行导入。这些可以参考所使用的系统的SAS帮助文档进行了解。
导入数据的常见方法
-
VIEWTABLE窗口导入
在菜单栏中选择工具 表编辑器,一个空的类似于EXCEL表格的窗口便会打开。你可以对列属性等进行设置,并手动在每个表格中输入数据,然后保存表,所创建的表将保存在逻辑库中。所创建的表可以在SAS程序中进行使用,例如,你在逻辑库sasuser中创建了一个名为test的表,现在在PROC步中进行打印,
VIEWTABLE窗口也可以用来打开现有的表进行浏览和编辑。
-
导入向导进行数据导入
在Windows和Unix系统使用导入向导,可以将各种数据文件转换成SAS数据集,导入向导通过扫描文件内容确定变量的类型,默认数据的第一行作为变量名。
从菜单栏中选择文件 导入向导启动导入向导,然后进行文件类型的选择,源文件的位置,指定文件分隔符,为所创建的数据集选择SAS逻辑库和成员名称。需要注意的是,所选择的逻辑库是需要提前创建好的,无法在导入向导中创建逻辑库。可以使用SAS窗口环境中菜单栏的新建逻辑库选项和LIBNAME语句进行创建。
LIBNAME libref_name "your-SAS-data-library";
-
使用DATA步进行数据的读取
在SAS程序中,使用DATA步进行数据的读取创建SAS数据集是最常见的方式,一般的语句形式:
DATA data_set_ref;
INFILE "file_pathway";
INPUT var_name1 var_name2 var_name3 var_name4 var_name5;
RUN;