1 QCA步骤
(1)数据校准(calibrate):基于理论将连续变量校准成清晰集(crisp set:二值或者多值)或模糊集(fuzzy set)
(2)创建真值表(truthTable),得到所有观测到(和未观测到)的组态causal conditions
(3)对真值表进行简化(minimize),得到对结果=0和结果=1的因果关系的逻辑表达式
2 由于因果树是反事实的框架,QCA如何进行反事实的操作呢?
理想情况是,按照处理变量的取值将样本分成2部分,一部分使用关系,一部分不使用关系,然后执行上述操作,得到四个结果:不使用关系高收入,不使用关系低收入,使用关系高收入,使用关系低收入四组结果。 如果对于使用关系高收入的结果,能够在不使用关系、低收入的结果中找到其他条件完全一致的情况,那么就可以认为,使用关系对收入有正向作用(相当于构造了匹配的样本),反之亦然。而根据"其他条件完全一致"的这一条件的组态,我们就可以得到使用关系对收入有正向作用的人群的特征。
然而,在现实中,这四种结果非常复杂,我们要通过肉眼去识别 “其他条件完全一致,且处理变量取值和结果取值”相反就变得非常困难(见附录)。
3 假设2可以顺利完成,那么QCA的结果与因果树如何结合?
由于QCA是一种二值逻辑,即使将连续变量转化成了模糊集,其本质也是二值的。例如将收入这个连续变量变成了模糊集,我们在做模糊集的操作时,首先对收入有一个“二值”的定义,即高和低,将收入变成模糊集后,新生成的这个变量所代表的含义是:个案的收入在多大程度上(A)属于高收入,就有在1-A的程度上属于低收入。可见,虽然A是一个在0-1之间的连续值,其本质也是也是“高、低”二分类的。
假设以上的第2步可以实现,我们通过QCA找出了在哪些人群中,使用关系的作用是正的,在哪些人群中使用关系的作用是负的。由于QCA是二值逻辑,我们得到的结果是:受教育程度低的,入职年份早的,且在体制内的党员……使用关系的作用是负的,其中,我们将受教育程度第操作化为没上过大学,将入职年份早操作化为1995年之前入职,这种划分是基于理论的,但基于理论的划分未免过于粗糙和武断。因此,在QCA之后,如果我们能够用因果树,用纯数据驱动计算出划分的阈值恰好能够与QCA的结果相符,那么不仅验证了QCA的结果,也验证了理论——在R的QCA包中,可以用intersection(QCA的解,“理论上的因果关系”)来计算理论与实证的交集,来看实证多大程度上与理论吻合。
当然,前提是以上第二步能够实现。
【附录】
不使用关系,高收入
GENDER*CEDU*tizhi_f*party_f*CFW_B*CWORK_YEAR_F +
CEDU*tizhi_f*party_f*HUKOU_F*CFW_B*CWORK_YEAR_F +
CEDU*TIZHI_F*PARTY_F*HUKOU_F*CFW_B*CWORK_YEAR_F +
gender*CEDU*tizhi_f*PARTY_F*HUKOU_F*CFW_B*cwork_year_f => CLNINC_F
不使用关系,低收入
gender*cedu*TIZHI_F*party_f + gender*cedu*party_f*hukou_f +
cedu*party_f*hukou_f*cfw_b +
cedu*party_f*HUKOU_F*cwork_year_f + gender*TIZHI_F*party_f*hukou_f*CFW_B +
gender*party_f*hukou_f*CFW_B*cwork_year_f +
gender*party_f*HUKOU_F*cfw_b*cwork_year_f +
GENDER*cedu*tizhi_f*party_f*cfw_b + GENDER*TIZHI_F*party_f*cfw_b*cwork_year_f +
cedu*tizhi_f*hukou_f*CFW_B*cwork_year_f +
gender*cedu*TIZHI_F*hukou_f*CFW_B*CWORK_YEAR_F +
gender*cedu*TIZHI_F*HUKOU_F*cfw_b*CWORK_YEAR_F +
GENDER*cedu*tizhi_f*hukou_f*cfw_b*CWORK_YEAR_F +
GENDER*cedu*TIZHI_F*hukou_f*cfw_b*cwork_year_f +
GENDER*CEDU*TIZHI_F*HUKOU_F*cfw_b*cwork_year_f +
GENDER*cedu*tizhi_f*PARTY_F*HUKOU_F*CFW_B*CWORK_YEAR_F +
GENDER*CEDU*tizhi_f*party_f*hukou_f*CFW_B*CWORK_YEAR_F => clninc_f
使用关系,高收入
GENDER*CEDU*TIZHI_F*PARTY_F*HUKOU_F*CWORK_YEAR_F +
GENDER*CEDU*TIZHI_F*PARTY_F*cfw_b*CWORK_YEAR_F +
GENDER*TIZHI_F*PARTY_F*HUKOU_F*cfw_b*CWORK_YEAR_F +
gender*CEDU*tizhi_f*PARTY_F*HUKOU_F*CFW_B*cwork_year_f +
GENDER*CEDU*tizhi_f*PARTY_F*hukou_f*CFW_B*cwork_year_f +
GENDER*CEDU*TIZHI_F*party_f*hukou_f*CFW_B*CWORK_YEAR_F +
GENDER*CEDU*tizhi_f*party_f*HUKOU_F*CFW_B*CWORK_YEAR_F +
gender*CEDU*TIZHI_F*PARTY_F*hukou_f*CFW_B*cwork_year_f => CLNINC_F
使用关系,低收入
cedu*party_f*cwork_year_f + gender*cedu*party_f*CFW_B + cedu*tizhi_f*party_f*cfw_b +
cedu*party_f*hukou_f*cfw_b + gender*tizhi_f*party_f*hukou_f*cwork_year_f +
gender*TIZHI_F*party_f*hukou_f*CFW_B + GENDER*cedu*TIZHI_F*PARTY_F*hukou_f +
TIZHI_F*party_f*HUKOU_F*cfw_b*cwork_year_f +
GENDER*cedu*PARTY_F*hukou_f*CFW_B*CWORK_YEAR_F +
GENDER*CEDU*tizhi_f*party_f*hukou_f*CFW_B*CWORK_YEAR_F => clninc_f