STATA初步学习

  1. 简单介绍
    sysuse使用系统包(system datasets)
    data editor(browse)或工具栏的 或者代码browse以表格形式查看数据,列表示变量(variable),行表示对变量的一次观测(observation)
    数据中的dot(.)代表缺失数据

describe表示对数据结构的描述

图片.png

解释:obs:观测数目; vars:变量数目; 1978 Automobile Data是data label; variable name是一个Stata Name
notes查看数据说明
summarize描述数据本身一些统计量(可简写为sum)

 注意观测数据可能因为观测为文本(string)或缺失导致不同
codebook + 数据名可以详细查看一个数据

可能出现的三种类型:
string(text)
indicator variable
categorial variable

browse if missing(rep78)
list make if missing(rep78) 关心的是rep78缺失对应的make
**the command list is used for listing observations.

summarize price, detail
detail 是一个选项(option)
筛选数据

tabulate 指标指令 生成一个频数\频率分布表 one way table列联表
tabulate rep78
tabulate rep78 foreign, row
row是一个选项,按行分配百分比

summarize mpg if foreign==0
summarize mpg if foreign==1

by foreign, sort: summarize mpg
prefix command by 前缀命令,他有一个自己的选项sort

tabulate foreign, summarize (mpg)
ttest mpg, by(foreign)
简单的假设检验

correlate mpg weight
相关矩阵,简写为cor
by foreign, sort: correlate mpg weight
按照foreign 分类
correlate 可以分析多个变量,这在分析共线性过程中非常有用

简单画图
scatter mpg weight
twoway (scatter mpg weight)
加上twoway的理由:可以结合和覆盖其他的图形

分类画图
twoway (scatter mpg weight), by(foreign, total)
使用选项by(),如果使用前缀by,则分开画图而不是显示为几个子图

regress 线性回归
predict mpghat
predict命令,用在regression命令后,称之为后估计命令(postestimation command)

two way (scatter mpg weight) (line mpghat weight, sort), by(foreign)

stata’s command syntax:

核心地位是command
if in 起到限制作用qualifier

  1. STATA用户界面
    界面:
    windows, toolbar, menus, dialogs

five main windows: Review Results Command Variables Properties
检查窗口、结果窗口、命令窗口、变量窗口、属性窗口

工具条:

命令窗口:
Page Up
Page Down
Tab

结果窗口:
Ctrl+F 查询
右键/clear result

检查窗口:显示历史命令
有一个筛选按钮(可以更改筛选设置)
右键可以实现主要功能:
单击到command window,双击直接运行,可以转移到一个do-file中,或者保存代码到一个do-file中

变量窗口:
单击变量选中,双击进入command window,或者每个变量左边有一个箭头标识,单击即可。
筛选变量
排序变量:不改变数据集中的顺序

属性窗口:显示变量窗口中选中变量的属性,若选中多个变量,则显示共同属性
左上角有一个 的标志,便于更改变量的标签、数值类型与显示格式

  1. 使用查看器(viewer)
    功能:1.查看帮助;
    2.增加、删除、管理第三方扩展程序

file/view 可以选择查看的文件,包括内置的帮助文档,Stata Markup and Control Language(SMCL文件)
view + 文件路径
可以查看帮助
search commandname

  1. 下载和储存数据
    use
    sysuse
    webuse
    不加路径的只能是当前所在路径,见左下角的路径名称。如果文件中有空格,就必须用“”括起来
    删除现有变量:clear,或在命令后加入选项, clear
    从电子表格复制数据要小心,不含有空白行,空白列,重复标题,合并单元格

 Importing data
Import delimited + 文件名 .txt或者.csv 默认以逗号与空格为分隔符
Import excel + 文件名 xls 或者xlsx

import delimited’s delimiters()更换分隔符
list, separator(0) 展示数据
list中超过8个字符就缩写了(~代表缩写),因此可以加入abbriviate(abb)选项
list, separator(0) abbreviate(10)

可以在导入之前写入变量名
import delimited make price mpg weight gear_ratio using "a few cars.csv"

import excel "D:\我的文档\大学学习\大四上\计量\data\Table 6.4.xls", sheet("Table 6.4") firstrow clear
保存为.dta文件
save afewcars

  1. Labeling data
    Three locations:
  2. The variable name is the name we use to tell Stata about a variable.
  3. The storage type (otherwise known as the data type) is the way in which Stata stores the data in a variable. There are six different storage types, each having its own memory requirement:
    a. For integers:
    byte for integers between ——127 and 100 (using 1 byte of memory per observation)
    int for integers between——32,767 and 32,740 (using 2 bytes of memory per observation)
    long for integers between ——2,147,483,647 and 2,147,483,620 (using 4 bytes of memory per observation)
    b. For real numbers:
    float for real numbers with 8.5 digits of precision (using 4 bytes of memory per
    observation)
    double for real numbers with 16.5 digits of precision (using 8 bytes of memory per
    observation)
    c. For strings (text) between 1 and 2,045 bytes (using 1 byte of memory per observation per
    character for ASCII and up to 4 bytes of memory per Unicode character):
    str1 for one-byte-long strings
    str2 for two-byte-long strings
    str3 for three-byte-long strings
    ……
    str2045 for 2,045-byte-long strings
    d. Stata also has a strL storage type for strings of arbitrary length up to 2,000,000,000 bytes.
    strLs can also hold binary data, often referred to as BLOBs, or binary large objects, in databases.

The display format controls how the variable is displayed

命名数据集(data label):label data + 数据集名称, 或者在Properties框更改
命名变量名(variable label):label variable + 变量名称,或者在Properties框更改

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,254评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,875评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,682评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,896评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,015评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,152评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,208评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,962评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,388评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,700评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,867评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,551评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,186评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,901评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,689评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,757评论 2 351

推荐阅读更多精彩内容