2.1-2.2 为什么使用stata、stata的窗口

2.3 stata操作示例
2.3.1 导入数据
(1)导入excel数据:
导入excel数据:打开“数据编辑器”→复制→粘贴→“第一行为变量名还是数据?”→选择
在file下边导入数据:file→import→选择导入文件的类型
(2)保存stata格式数据
- 直接选择“save图标”,保存文件格式为.dta
(3)打开stata数据集
从“打开文档(ctrl+o)”命令打开
命令 use E:\grilic_small.dta,clear
2.3.2 变量的标签
(1)点击“变量管理器”按钮,在编辑器那里自己定义,提醒自己变量的含义
(2)建议用小写标记变量名
2.3.3 审视数据
describe→简写 d
含义:这个命令对数据做简单描述,多少个变量、多少个样本,占了多大内存等等
list s linw→简写l
含义:这个命令的作用:罗列某个变量
备注:可能会出现more,这是结果在下一页的意思
set more off
含义:不用一直点more,直接显示所有罗列的内容
set more on
含义:回复分页显示
list s lnw in 11/15
含义:只罗列从11到15个s和lnw
list s lnw if s>=16
含义:运用逻辑语句
备注:其他逻辑符号,==(等于)=(赋值)~=(不等于)!=(不等于)
drop if s>=16
含义:删除数据(删除以后就不能撤回了哦~)
keep if s>=16
含义:保留部分数据
sort s
list
含义:就是把s按照从小到大来排序
gsort -s
List
含义:根据s的取值,从大到小降序排列
2.3.4 画图
histogram s, width(1) frequency
含义:①histogram表示直方图,缩写是hist②width表示宽度,如果不选的话,stata会自己根据数据特点进行判断③frequency表示将纵坐标定位频数,缩写freq,就是在这个区间的有几个人
help hist
含义:可以了解hist的语法
scatter lnw s
含义:做lnw与s的散点图,简写sc,这个图有缺陷,不知道哪个点对应哪个样本,所以可以打标签
gen n=_n
sc lnw s,mlabel(n)
含义:首先产生一个新变量,然后作带有标签的散点图
2.3.5 统计分析
summarize s
含义:简写是su,查看变量数量,均值,最大值,最小值等
备注:如果不指明哪个变量,就会显示所有变量的内容
tabulate s
含义:简写是ta,可以画出变量s的经验累积分布函数
pwcorr lnw s wxper,sig star(.05)
含义:pwcorr表示“pairwise correlation”,可以用来计算两两之间的相关性,sig表示要把显著相关系数的显著性水平(p值)列在相关系数下边,star(.05)表示要给显著性水平小于0.05的打上星星
2.3.6 生成新变量
g lns=log(s)
含义:定义教育年限的对数
g s2=s^2
含义:定义s的平方项
g exprs=s*expr
含义:定义教育年限s与经验expr的交互项
g w=exp(lnw)
含义:根据工资对数lnw计算工资水平w
g colleg=(s>=16)
含义:g可以用来定义虚拟变量,即s≥16的人是受过高等教育,colleg=1;否则,celleg=0
rename colleg college
含义:对变量colleg重新命名,且重新命名后,之前的colleg的数据无法保存
备注:重命名也可以使用变量管理器
drop college
g college=(s>=15)
含义:风险s≥16定义错了,现在是重新定义s≥15为college
replace college=(s>=15)
含义:和上一个命令可以实现一样的功能
drop s*
含义:可以同时去掉内存中的s1,s2,s3,且drop后无法恢复
s1-s5
含义:可以同时代表s1 s2 s3 s4 s5这五个变量
2.3.7 stata****的计算器的功能
display log(2)
含义:展示log(2)的数值
dis 2^0.5
含义:展示2开根号的结果
2.3.8 调用命令与终止命令
· 直接在命令窗口单击就可以重新在命令窗口出现;双击就会再次执行
· 中途要终止某个命令的执行,点击红底白色叉叉,或者“Ctrl+Break”
2.3.9 stata****的日志
命令太多了,就保存:
方法1:File→log→Begin,即保存log文档
方法2:点击日记本保存就好了
方法3:log using today(建立日志文件)/log off(暂时关闭日志文件)/log on(回复日志记录功能)/log close(彻底关闭日志文件)
2.4 Stata命令库的更新
update all
含义:更新所有的命令
ssc install newcommandplus
含义:newscommand是新命令的名称,这个命令是从ssc平台下载新命令
sysdir
含义:现实stata的ado\plus\personal等文件的路径系统
将下载的新命令文件复制到所指示的文件夹即可
search keyword
含义:keyword是你自己想要的东西,让stata去stata的公司自动搜索相关命令
findit keyword
含义:进一步的去搜索
2.5 进一步学习Stata的资源


- 备注:要经常看help 菜单,以及常看Stata手册(每个命令都有自己的手册)