计量结果可能较长,包含密密麻麻的表格与数字。如何看?
诀窍:计量结果可能很复杂,但真正重要的信息通常不多,比如回归系数(含符号)、 p 值,以及样本容量、拟合优度等统计量。
以一元回归为例(工资对数对教育年限回归),回归结果参见图1
图1工资对数对教育年限的回归结果
变量 s(教育年限)的回归系数符号为正,系数估计值为0.0966245, p 值为 0.000,样本容量为758,拟合优度R2为0.2527。
左上角的残差平方和、右下角的置信区间,乃至常数项等信息,基本可不关心。
在解释回归系数时,注意区分统计显著性与经济显著性。
“统计显著性”(statistical significance)主要通过p值来考察,如果p 值小于或等于 0.05,则该系数在统计上显著不等于零;反之,则在统计上不显著,可将此系数视为零(不存在)。
“经济显著性”(economic significance)主要通过系数的绝对值来考察,须特别注意变量的取值单位。
在上例中,教育年限 s 的单位为年,工资对数 lnw可解释为工资的百分比变化,故s 的回归系数为 0.0966245 意味着,每增加一年教育,未来工资收入将提高 9.66%,具有很高的经济显著性(可能过高了)。
假如 s 的回归系数为 0.01 或 0.001,则每增加一年教育,未来工资收入只会上升 1%或 0.1%,在经济意义上很不显著。
统计上显著而经济上不显著,意味着解释变量对被解释变量的影响很小(经济上不显著),尽管这种影响的幅度被估计得很精确(统计上显著)。
进行假设检验时,Stata 可能输出很多结果,最需关注的只是原假设以及 p 值;知道二者就可进行检验,其余都是细节。将数据导入 Stata,输入相应命令,是“见证奇迹的时候”(moment of truth)。
如果所得计量结果未尽人意,怎么办?
出现这种情况,可能有三种原因。
(1) 计量方法不当。比如,在上述一元回归中,显然遗漏许多变量,存在遗漏变量偏差,导致 OLS 不一致。更一般地,如果存在内生性而未加以处理,将导致不一致估计,使得本应显著的变量变得不显著。
(2) 数据质量有问题。如果数据存在较大的度量误差,所用代理变量与真实变量相差较远,或者数据输入中的人为错误,都可能影响估计的一致性。
(3) 经济理论有问题。排除以上两种可能性后,最后一种可能性是,经济理论不正确。经济理论预期的某种效应可能不存在;或者同时存在其他作用机制,使得净效应的符号相反。实证研究的目的之一就是检验经济理论。如发现已有理论与经验证据不符,说明理论尚有改进空间,甚至需要放弃。
正如林毅夫(2001, p. 75)所指出:
如果发现理论推论和我国经验事实不一致,要坚持的不是现有的理论,而是进一步去了解我国的经验现象, 然后, 根据经验现象构建一个可以解释这个现象的理论。所以, 当发现这种不一致时, 不要死抱理论, 成为现有理论的俘虏, 也不要在巨人的面前而感到自己渺小。其实,这正是对理论发展做出贡献的绝好机会。