因果推断深度学习工具箱 - Adapting Neural Networks for the Estimation of Treatment Effects

文章名称

Adapting Neural Networks for the Estimation of Treatment Effects

核心要点

文章主要针对binary treatment的场景,能够用来估计ATE和CATE。作者提出Dragonnet网络架构,并采取两阶段的学习架构。首先,估计outcome和propensity score,随后,在这个基础上利用targeted regularization,估计causal effect。targeted regularization是非参估计理论中被广泛应用到神经网络的一种正则化方法。

方法细节

问题引入

在unconfoundedness的假设下,我们可以通过调整covariates来从观测数据中无偏的估计因果效应。当propensity score的估计充分且模型假设正确的情况下,对propensity score的调整,可以代替covariates的调整,用来进行causal effect的无偏估计。也就是说,只调整covariates中和treatment assignment相关的covariates就可以。
但是,只是上边这种方法是不能很好估计causal effect的。因为,并没有直接限制两种不同的treatment下covariates或者propensity score的分布具有相似性(balancing)。因此,作者引入targeted regularization,

具体做法

为了模仿通过propensity score来调整covariates,可以利用神经网络来估计propensity score,随后删除掉最后一层预测网络,利用学到的embedding Z来作为特征来构建outcome prediction网络。这种方法“很”表示学习(或者说深度学习),通过这个网络,预测outcome相当于基于propensity score来进行outcome预测。但是,这种方法是两阶段的,会导致propensity score的估计误差传递给outcome prediction。深度学习炼丹师自然想到multitask learning,通过多个输出头,由数据决定应该学习哪些特征,放弃哪些特征,并且同时考虑propensity score估计和outcome prediction。Dragnnet的网络结构如下图所示,\hat{g}(\cdot)是propensity score预测层,Z是最后的embedding。

Dragonnet

具体的输出预测损失如下图所示。
prediction loss

(To be continued...)

代码实现

(留坑待填...)

心得体会

condition on propensity score predictor?

Dragonnet利用propensity score prediction网络的嵌入学习能力纠正偏差。其实,就是调整confounder,但是,看过RSB-Net,我们不应该去在乎其他和treatment assignment相关的元素,却和outcome prediction没关系的covariates。从这个角度看,Dragonnet其实有引入和outcome prediction无关的噪音covariates。同时,其实还有一些covariates是只和outcome prediction有关系,也应该被用来predict outcome。这部分在Dragnnet中体现在两个outcome prediction的head上。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容