一个好的模型应该具备哪些特点?
经济计量学家哈维(A.C.Harvey)列出了模型判断的一些标准 :
简约性(parsimony):满足需要,无不必要的修饰,less is more。奥卡姆剃刀原则。
可识别性(identifiability):一组数据一个参数估计结果。可重复性,模型是稳定的。
拟合优度(goodness of fit):判定系数,解释平方和/总平方和的值足够大。
理论一致性(theoretical consistency):建立模型之前必须进行经济理论的分析,结果也应该与基本的经济理论保持一致。
预测能力(predictive power): 基于对过去的解释对未来进行预测。
设定误差会导致OLS估计量失去BLUE估计量所具有的优良性质,即不再无偏、有效和一致,也就是不再是一个好的模型。其中包含不相关变量对模型的影响最小,这种情况下估计量是无偏和一致的,但估计的精度下降,也就是不再有效。
设定误差的一个狭窄定义就是误差项中的边缘变量与核心解释变量相关。在实践中经常遇到的设定误差有:
• 遗漏相关变量
• 包括不必要变量
• 采用了错误的函数形式
• 度量误差
如何对设定误差进行检验呢?在这里主要讨论对遗漏变量以及不正确函数形式的检验。
1、残差检验:遗漏重要变量时,残差与解释变量有关,呈现系统性模式。
图为残差对被解释变量拟合值的曲线,蓝色为包含所有变量的曲线,红色为遗漏相关变量的曲线,这两条曲线显示出一些系统模式,红色曲线不仅要反应出真实的随机误差项,还要反应出未被包含的变量。
2、麦克金农-怀特-戴维森检验(MWD 检验)
对采用不正确函数形式的模型进行检验。
H0原假设:线性模型: Y是X的线性函数。
H1备择假设:对数线性模型: InY 是X或InX的线性函数。
MWD检验步骤如下:
(1)估计线性模型,得到Y的估计值。
(2)估计线性对数模型,得到lnY的估计值。
(3)求Z1=ln(Y的估计值)-( InY的估计值)。
(4)做Y对X和Z1的回归。
如果根据t检验Z1的系数是统计显著的,则拒绝H0。
(5)Z2 = InY的反对数-Y的估计值。
(6)做lnY对X或lnX和Z2的回归。
如果Z2的系数是统计显著的,则拒绝H1。
3、拉姆齐RESET(回归误差设定)检验
在进行RESET检验之前,可以先绘制残差对拟合值的检验图来做预先判断。根据高斯马尔科夫定理的假设,被解释变量拟合值与残差是不相关的。但是从图中可以看出两者存在一定的相关性(可能是某种曲线形式),因此,可以在模型中加入被解释变量的拟合值的幂次,一般为二次幂和三次幂,如果增加的R方是统计显著的,或者说校正判定系数增加时,原始模型是设定错误的。
stata实现
残差检验
reg y1 x1
predict y_hat 将y的拟合值赋给y_hat
predict u1,r 将残差项赋值给u1
reg y2 x1 x2
predict u2,r 将残差项赋值给u2
line u1 u2 x 绘制残差序列图
MWD检验
注意的地方:exp( x) 取反对数
RESET检验
注意的地方:rvfplot 残差对拟合值作图
rvfplot residual-versus-fitted plot rvpplot residual-versus-predictor plot 后面要加相应的变量
格兰杰所说:
建模既是一门艺术也是一门科学,仅靠经济计量学知识和计算机统计软件并不足以确保能够成功。