RDDとは

Regression Discontinuity Designのこと。RCTが行えない場合にRCTと同じ状況を擬似的に再現する手法の一つ。

設定

  • $W_i\in{0, 1}$ : 介入
  • $Y_i(W_i)$: 潜在アウトカム

RDDでは$W_i$をランダムに割り振るのではなく、あるスコア$Z_i$とカットオフ$c$を使って、

\[W_i = \mathbb{I}(\{Z_i\geq c\})\]

で割り振る。RDDの割り振りは$Z_i$の値に基づいているので、ランダムではないものの$Z_i=c$の境界付近の集団のデータについてはランダムとみなせるだろう というのが、RDDのアイデアである。

なぜIPW推定量などを用いることができないか

IPW推定量は擬似的にRCTをシミュレートする手法であり、以下の2つの仮定を置いていた。

  1. $\,{Y_i(0), Y_i(1)} \perp W_i \mid Z_i$ (unconfoundness)
  2. $\,\exists \eta\in(0, 1) \text{ s.t. } \eta \leq \mathbb{P}[W_i=1\mid Z_i] \leq 1 - \eta$ (overlap)

上の2つの仮定は、データセットが$Z_i$の値が同じ人については小規模のRCTが行われているとみなせるということを表している。

RDDでは $W_i$ の割当は確率的に定まる状況ではなく、$Z_i \leq c$ であるかで決定的に定まっている。したがって、$Z_i < c$のとき$\mathbb{P}(W_i=1\mid Z_i)=0$でありoverlapの仮定が崩れる。

収束レートについて

$\mu_{(w)}(z):=\mathbb{E}[Y_i(w)\mid Z_i]$とする。$\mu_{(0)}(z),\mu{(1)}(z)$の両方に連続性を仮定すると、$\tau_c:=\mu_{(1)}(c) - \mu_{(0)}(c)$ について

\[\tau_c = \lim_{z\downarrow c} \mu_{(1)}(z) - \lim_{z\uparrow c}\mu_{(0)}(z)\]

が成り立つはずである。なおサンプルサイズ$n$について$\mu_(w)(z)$の二階微分が$z=c$の近傍で一様バウンドできているとき、次節で紹介する局所線形回帰の手法は$n^{-2/5}$のレートを達成可能である。 収束レートの導出の概略がCausal Inference(スタンフォード大学の講義資料, stats361)に載っている。

推定方法について

実際には$z_i=c$の近傍には有限のデータしか存在しないので $z_i\to c$ とすることはできない。そこで局所線形回帰を用いた推定方法などがある。これは、

\[\hat{\tau}_c := \mathop{\mathrm{argmin}} \left\{\sum_{i=1}^n K\left(\frac{|Z_i-c|}{h_n}\right)(Y_i - a - \tau W_i - \beta_{(0)}(Z_i - c)_{-} - \beta_{(1)}(Z_i - c)_{+})^2\right\}\]

で推定する手法である。$\tau$が今知りたいパラメータで、$a$は切片、$\beta_{w}(w=0,1)$は局外パラメータである。$\beta_{0}$の項は$z<c$で、$\beta_{1}$の項は$z>c$で現れるようになっている。$K(x)$は適当な重み付け関数で、窓関数 $K(x)=\mathbb{I}({|x|\leq 1})$や三角カーネル$K(x)=(1-|x|)_{+}$などを用いたりする。$h_n$はサンプルサイズに合わせたバンド幅のパラメータである。

参考文献