数据的导入导出常见的需求,在我个人的成长过程中,只就SAS base、 SAS EM这两个说一下。
base导入:
(1) SAS表导入: data outname; set database; run;
(2) 外部数据: proc import out= datafile="" dbms=excel replace; run;(replace不是必须)
(base导入数据中包含非法字符等,可扩展一下SAS默认的命名规则。 方法是:options validvarname=any;)
EM导入:
(1) SAS表导入:文件-新建-逻辑库,为数据集创建一个逻辑库;(2)数据源(鼠标右击)-创建数据源,根据SAS弹出的对话框一步步进行。注:EM只能是SAS表,因此,其他来源的数据需先转化成SAS格式,在转化格式时,我遇到一个问题是excel表中,字段名为中文字符、中文空格、非法字符时,导出的表格是无法正确导入的。编码字符通常情况下是英文、数字和_ 。
SAS默认的是V7。其规则是:·最长32字符;·首字符可以拉丁字母和下划线,后继的字符可是字母和下划线,还有数字符号;·末尾空格忽略,且左对齐;·中间不能包含空格和特殊字符(下划线除外);·字符大小写均可,不作区分;·不能为SAS自动变量,如_N_、_ERROR_等;
(2) 外部数据导入:抽样-外部文件-导入文件