删除了一处明显错误:第一个和第二个孩子的初婚年龄小于等于5的样本。
剩下的几个孩子的样本等用到了再删吧,其实我还是保守了,我感觉初婚年龄小于等于12的都可以删。
然后用第二个孩子跑数据试了试,现在显著了。样本量为8483。
首先是总模型,既包括核心解释变量也包括中介变量:
然后以初婚年龄为因变量,重新跑模型:
又显著了,而且系数符号正确,中专确实可以减小初婚年龄。
然后是只有解释变量和被解释变量的模型结果:
因为是部分中介,所以接下来就要检查中介效应占总效应的比例:
先总的看一下三个模型:
参考这位同学:
因为bd和c是同号,所以通过bd/a来计算,结果大概是20%左右。
接下来是对结果的完善:
首先尝试加入所在县的固定效应:
暂时没有找到所在县这个变量,先搁置。
接下来的任务就是:
首先按照周兴的论文把缺的变量补齐(包括剩下的解释变量),看看会不会使结果更稳定。
然后学习2sls回归和probit模型,寻找增加论文丰富度的方法。
然后找方法解决内生性问题。