用R进行数据格式转换(SAS, Stata)

​ 我们在进行合作研究的时候,经常面临的的一个问题就是,一个Co-author给的数据集是stata格式的(.dta), 而我们用的是SAS,或者相反,还有很多研究者习惯用SAS清洗数据,完成后用Stata 跑回归,在这些情况下我们都会面临一个数据格式转换的问题,那么今天我们就来谈一下如何用R来帮助格式转换。

为什么是R? 因为它是开源的,你可以在没有安装SAS和Stata的情况下完成.sas7bdat.dta的转换

看到R有些人可能就要关闭文章了,因为不想又学一个软件,其实,我们完成数据转换不需要真正的搞懂R的code,只需要跟着我一步一步来就可以了,比把大象装冰箱还简单。

  1. 下载安装R
    到R的官网下载安装对应平台的R程序。

  2. 安装需要的packages

# 类似于Stata的 ssc install
install.packages('haven', repos = 'http://cran.us.r-project.org') 
# 表示我们要从R的官网安装一个包名字叫 haven

然后我们就可以用啦 ~

SAS 转 Stata

把下面的code粘贴单R的console里面,等着

library(haven) # 加载包
dataset <- read_sas("C:/example.sas7bdat")  # 把SAS数据读进来

# 把它导出为14版本的stata数据
# version 可以是8 -14 的任何一个  
# 你也可以借此完成不同的stata版本数据的转化
write_dta(dataset, "C:/example.dta", version = 14)  

Stata 转 SAS

把下面的code粘贴单R的console里面,等着

library(haven) # 加载包
dataset <- read_dta("C:/example.dta")  # 把Stata数据读进来
write_sas(dataset, "C:/example.sas7bdat")  # 把它导出为SAS格式

转换完成仍会保留你为变量加的标签哦

haven还可以转换其他的格式如下表所示:

NAME FUNCTION
read_dta() Read and write Stata DTA files.
read_por() Read SPSS (SAV & POR) files. Write SAV files.
read_sas() Read and write SAS files.
read_sav() Read SPSS (SAV & POR) files. Write SAV files.
read_xpt() Read and write SAS transport files
write_dta() Read and write Stata DTA files.
write_sas() Read and write SAS files.
write_sav() Read SPSS (SAV & POR) files. Write SAV files.
write_xpt() Read and write SAS transport files

One more thing

当然,如果你想导入.csv可以用 readr package, 如果导入.xls, .xlsx 可以用readxl package,安装方法如上,使用方法也很简单。你也可以导入.csv 然后用上面的程序导出SAS或者Stata格式或者SPSS格式,都十分方便。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容