1. 前言
在目前工作中,用stata清洗及分析数据,感觉很顺滑。无奈不少同学因为help文件里的英文望而却步。
带着学习和分享的目的,根据工作经验,给大家整理一些常用以及不太常用但很有用的命令,并对该命令的help文件进行有侧重的详解。
2. 命令及获取
tabulate
oneway:一维频率表,系统自带命令
3. 描述
tabluate
:生成一维频率表,即只有1个变量的频率表,最短可缩写成ta
tab1
:生成多个一维频率表,即多个只有1个变量的频率表
4. 语法
*生成一维频率表
tabulate varname [if] [in] [weight] [, tabulate1_options]
*生成多个变量的一维频率表
tab1 varlist [if] [in] [weight] [, tab1_options]
- [,]:中括号里的为额外选项命令,按需求添加,而添加选项记得加英文逗号,
- [if]:表示增加条件,例如,变量var等于1,
if var==1
。- [in]:表示选择个案数,例如,选择前10个个案,
in 1/10
。- [weight]:表示加权,例如,权重变量为pop,
fweight=pop
。
5. 选项
tabulate1_options
的选项:- 主要选项
subpop(varname)
:添加该选项,在频率分析时,将varname=0进行排除,但显示出该类,并计为0。missing
:添加该选项,在频率分析时,将缺失值也作为一类进行频率分析。最短可缩写成mnofreq
:添加该选项,不显示频率结果。最短可缩写成nofnolabel
:添加该选项,数值型变量不显示变量标签,显示数值。最短可缩写成nolplot
:添加该选项,生成相对频率的条形图。最短可缩写成psort
:添加该选项,频率分析结果按照频率数由高到低进行排序展示,若频率相同,则按变量升序排序。- 高级选项
generate(stubname)
:添加该选项,生成n个以subname为前缀的变量,n为频率类别数-1。不能和by
结合使用。最短可缩写成g()matcell(matname)
:添加该选项,将频率数保存为matname。用于编程。matrow(matname)
:添加该选项,将频率类别保存为matname。字符串变量不可添加本选项。用于编程。tab1_options
的选项:同tabulate1_options
的主要选项。
6. 举例
*调入系统自带数据census.dta
sysuse census
*对变量region进行频率分析
ta region
*调入系统自带数据auto.dta
sysuse auto
*对变量mpg进行频率分析,foreign等于0时不计入在内
ta mpg,subpop(foreign)
*调入系统自带数据auto.dta
sysuse auto
*对比:对变量mpg进行频率分析,foreign等于0时不计入在内
ta mpg if foreign!=0
*调入系统自带数据auto.dta
sysuse auto
*对变量rep78进行频率分析
ta rep78
*对变量rep78进行频率分析,将缺失值作为1类
tab rep78,m
*调入系统自带数据auto.dta
sysuse auto
*对变量foreign进行频率分析
tab foreign
*对变量foreign进行频率分析,不显示频率结果
tab foreign,nof
*调入系统自带数据auto.dta
sysuse auto
*对变量foreign进行频率分析
tab foreign
*对变量foreign进行频率分析,不显示值标签
tab foreign,nol
*调入系统自带数据auto.dta
sysuse auto
*对变量foreign进行频率分析
tab foreign
*对变量foreign进行频率分析,相对频率的条形图
tab foreign,p
*调入系统自带数据auto.dta
sysuse auto
*对变量rep78进行频率分析
ta rep78
*对变量rep78进行频率分析,按频率数降序排序
tab rep78,sort
*调入系统自带数据auto.dta
sysuse auto
*对变量rep78进行频率分析
ta rep78
*对变量rep78进行频率分析,并生成多个虚拟变量,前缀为new
tab rep78,g(new)
7. 菜单
tabulate
onewayStatistics > Summaries, tables, and tests > Frequency tables > One-way table
tabulate ……,generate()
Data > Create or change data > Other variable-creation commands > Create indicator variables
tab1
Statistics > Summaries, tables, and tests > Frequency tables > Multiple one-way tables
8. 存储的结果
tabulate
和tab1
存储下列结果:
r(N)
:个案数r(r)
:行数
9.补充
- 无