为什么要用工具变量
解决内生性问题,自变量与残差相关,即
变化时,随机扰动项也会变化,导致估计值偏离真实值
什么是工具变量
变量成为自变量的有效工具变量需满足2个条件:
- 相关性:工具变量与内生变量相关
- 外生性:工具变量外生
为什么工具变量能解决内生性问题
一阶段回归:
代入Y与X关系式:
得到简约式回归:
虽然,但是由一阶段回归可以得出:,由工具变量的定义得出:,因此公式3中与随机扰动项不相关,满足线性回归基本假设。
由公式1得出,公式3得出,最终得到无偏估计量
在只有一个工具变量和一个内生变量时,以上简约式的结果等价于最小二乘法:
一阶段回归:
二阶段回归,与相关,与不相关,与、均不相关:
Y与X关系式:
由于与残差不相关,且,因此在只有一个工具变量和一个内生变量时,简约式的结果等价于最小二乘法,最终均能得到无偏估计量
如果为内生变量找到多个工具变量:
一阶段回归:
根据最小二乘法的原理,是与中信息的最优线性组合,再将代入2式,得到无偏估计量
需要特别说明的是两阶段回归的标准误差是错误的,正确的标准误差是
工具变量通俗解释
工具变量相当于一个过滤器,把分成两部分,第一部分和有关(即),第二部分和无关(即)。由于与无关,第一部分自然也和无关,第二部分是要过滤掉的渣子:中包含的和有关的东西
内生性的检验:Hausman test
Hausman test的原假设是:所有解释变量均为外生变量,然后比较IV估计值和OLS估计值和的差异,如果很大,说明存在内生性问题,如果比较小,则不存在。
参考
工具变量原理:http://www.liuyanecon.com/wp-content/uploads/1017%E5%AD%94%E5%BD%A4%E9%98%B3.pdf
工具变量原理:https://www.lianxh.cn/news/b4c8cc6e6d1ba.html
工具变量例子:https://blog.51cto.com/tecdat/2770438
http://blog.sina.com.cn/s/blog_4a839b9a0100i2m2.html
工具变量通俗解释:https://www.zhihu.com/question/29067965
deepIV(两阶段最小二乘推广到非线性模型):https://zhuanlan.zhihu.com/p/88235983