stata乱码解决方案说明

1 乱码出现原因

如今Stata进入16时代，各项功能日趋完善。Stata的各个版本之间中文格式存在较大差异，目前最新版本为Stata16，若使用Stata16打开使用其他版本数据，可能出现乱码的情况。

Stata14运用了适用性更广的UTF-8编码格式，从而保证 do文档，dta 文档等文件中可以支持各种语言和字符，非英语用户再也不用一定使用英语字母作为变量名了。对于国内用户，使用 Stata 13 及早期版本保存的 do 文件和 dta 文件一般为 gb2312 或gbk 或 gb18030 编码，而 Stata 14 及高级版本采用的是 UTF-8 编码。所以早期版本Stata 保存下来的 do 文件和 .dta 文件在高级版本 Stata 下就会出现乱码的情况，主要包含以下三种情况：

情况1：数据集dta文件变量名或者变量标签存在乱码。

情况2：数据集dta文件当中的文本数值存在乱码。

情况3：Stata的do文档出现乱码。

2 乱码出现具体情况

2.1关于do文档

对于Stata新版本[1]（Stata16，Stata15，Stata14）之间，相互查看使用do文档，不会出现乱码的情况。例如：运用Stata16版本时，可以正常打开Stata15和Stata14的do文档，不会出现乱码情况。

对于Stata旧版本（Stata13，Stata13以下版本）之间，相互查看使用do文档，不会出现乱码的情况。

在通过Stata旧版本查看和运用Stata14版本及以上版本的do文件时，会出现乱码情况需要转码，例如：用Stata13打开Stata14版本的do文档，出现乱码，具体如下图：