4.1 一元线性回归模型简介
1.模型简介
2.stata实操
list s lnw in 1/10
含义:列出前10个数据
twoway scatter lw s||lfit lw s
含义:①同时画出散点图和线性拟合(lfit→linear fit)②先写因变量,lw是因变量
4.2 OLS估计量的推导
4.3 OLS的正交性
被解释变量:yi
拟合值/预测值:yi=yi(^)+ei
图1.png
图2.png
图3.png
图4.png
图5.png
4.4 平方和分解公式
TSS(总平方和)=ESS(回归平方和)+RSS(残差平方和)
4.5 拟合优度R^2
备注:R^2只是反映拟合优度的好坏,此外没有太多意义,评估回归方程是否显著,应使用F检验
4.6 无常数项的回归
- 即使没有常数项,OLS仍满足正交性
4.7 一元回归的Stata实例
reg lw s,noc
含义:做lw(因变量)对s(自变量)的回归,noc表示不要加常数项,默认有常数项
Coef:回归系数
4.8 Stata命令结果运行的存储与调用
- e类命令(estimation commands):估计命令
reg lw s
ereturn list
- r类命令(return commands)
sum s
return list
含义:展示r类命令的存储结果
记下来计算变异系数:即标准差除以平均值
display r(sd)/r(mean)
4.6 蒙特卡罗模拟
- 蒙特卡洛模拟(MC),通过计算机模拟,从总体抽取大量随机样本的计算方法
考虑如下数据生成过程(DGP)或总体回归模型
图6.png
- 假设解释变量xiN(3,2^2),扰动项 N(0,32),从N(3,22)随机抽取30个解释变量xi的观测值,并从N(0,3^2)随机抽取30个扰动项的观测值,然后根据总体回归模型计算相应的被解释变量,把yi对xi进行回归,得到样本总回归函数(SRF),并与总体回归函数(PRF)进行比较
Clear
set obs 30
含义:确定随机抽样的样本容量为30
set seed 10101
含义:制定随机抽样的种子为10101,制定随机数的初始值
gen x=rnarmal(3,4)
含义:得到服从N(3,4)分布的随机样本
gen e=rnormal(0,9)
含义:抽取残差
gen y=1+2*x+e
含义:计算被解释变量y
Reg y x
含义:回归
twoway function PRF=1+2*x,range(-5 15)||scatter y x||lift y x,lp(dash)
含义:①这个命令是把总体回归函数、散点图、样本回归函数都放在一起了②range(-5 15表示)横轴范围是-5到15,默认是range(0 1)