为什么要用工具变量
解决内生性问题,自变量与残差
相关,即
变化时,随机扰动项也会变化,导致估计值
偏离真实值
什么是工具变量
变量成为自变量
的有效工具变量需满足2个条件:
- 相关性:工具变量与内生变量相关
- 外生性:工具变量外生
为什么工具变量能解决内生性问题
一阶段回归:
代入Y与X关系式:
得到简约式回归:
虽然,但是由一阶段回归可以得出:
,由工具变量的定义得出:
,因此公式3中
与随机扰动项
不相关,满足线性回归基本假设。
由公式1得出,公式3得出
,最终得到无偏估计量
在只有一个工具变量和一个内生变量时,以上简约式的结果等价于最小二乘法:
一阶段回归:
二阶段回归,与
相关,与
不相关,
与
、
均不相关:
Y与X关系式:
由于与残差
不相关,且
,因此在只有一个工具变量和一个内生变量时,简约式的结果等价于最小二乘法,最终均能得到无偏估计量
如果为内生变量找到多个工具变量:
一阶段回归:
根据最小二乘法的原理,是
与
中信息的最优线性组合,再将
代入2式,得到无偏估计量
需要特别说明的是两阶段回归的标准误差是错误的,正确的标准误差是
工具变量通俗解释
工具变量相当于一个过滤器,把分成两部分,第一部分和
有关(即
),第二部分和
无关(即
)。由于
与
无关,第一部分自然也和
无关,第二部分是要过滤掉的渣子:
中包含的和
有关的东西
内生性的检验:Hausman test
Hausman test的原假设是:所有解释变量均为外生变量,然后比较IV估计值和OLS估计值和的差异,如果很大,说明存在内生性问题,如果比较小,则不存在。
参考
工具变量原理:http://www.liuyanecon.com/wp-content/uploads/1017%E5%AD%94%E5%BD%A4%E9%98%B3.pdf
工具变量原理:https://www.lianxh.cn/news/b4c8cc6e6d1ba.html
工具变量例子:https://blog.51cto.com/tecdat/2770438
http://blog.sina.com.cn/s/blog_4a839b9a0100i2m2.html
工具变量通俗解释:https://www.zhihu.com/question/29067965
deepIV(两阶段最小二乘推广到非线性模型):https://zhuanlan.zhihu.com/p/88235983