因果推断相关

0、因果推断背景知识
1、概念问题
1.1 概念一:干预效果 Treatment Effect
干预效果(Treatment Effect):干预下的潜在结果减去未干预时的潜在结果(Rubin框架),即:
τi=Yi(1)−Yi(0)
其中 Yi 表示潜在结果,1和0分别代表是否受到干预。
举个例子:我们想知道我养狗给我提升了多少幸福度,理想情况下就是用我养狗时的幸福度减去我不养狗时的幸福度
1.2 概念二:ATT Average Treatment Effect on the Treated
相较于个人的干预效果,我们更希望了解人群整体的干预效果,毕竟我们通常用策略干预的是一个人群。
应用PSM,我们通常希望计算得到被干预的用户的平均干预效果,即ATT(average treatment effect on the treated),即
τATT=E(τ∣D=1)=E[Y(1)∣D=1]−E[Y(0)∣D=1]
其中变量 D 代表是否收到干预。
可以看到 E[Y(0)∣D=1] 代表被干预的用户假如不被干预的情况下的潜在结果,是一个无法观测的数值。倘若可以建立AB测试,我们利用对照组则可以得到该结果,在无法进行AB测试的情况(例如 D 是一个主动的行为)下,我们可以通过PSM拟合一个虚拟的对照组进行计算。
1.3 计算ATT所需满足的假设
这里引入一个新的概念,倾向性得分(Propensity Score),即用户受到(参与)干预的概率: P(X)=P(D=1∣X)
1.
条件独立假设 CIA (Conditional Independence Assumption)
给定一系列可观测的协变量 X ,潜在结果和干预分配相互独立。
(Unconfoundedness) Y(0),Y(1) II D∣X,∀X.
可认为所有影响到干预分配与潜在结果的变量都同时被观测到。此时 X 可能是高维度的
若上式成立,则干预分配与潜在结果基于 P(X) 同样条件独立[可证明],即:
(Unconfoundedness given the PS) Y(0),Y(1) II D∣P(X),∀X.
2. 共支撑 Common Support
在一些文献中,该条件也被称为strong ignorability.
除了独立外的另一个条件是存在重叠的部分,即:
(Overlap) 0<P(D=1∣X)<1
这个条件能够排除掉——给定 X 时能准确确定 D 的情况(也因为如此才有匹配的空间)。
1.4 估算ATT
在满足CIA和common support的情况下,我们能够对ATT进行估算:
τATTPSM=EP(X)∣D=1{E[Y(1)∣D=1,P(X)]−E[Y(0)∣D=0,P(X)]}
即:在common support 上,以倾向分为权重、对实验组与对照组平均值的差值进行求和。
一、DID
原理: