自然実験とは

実験者の管理下にない状況で自然に発生した介入と非介入を割り当てるイベントのこと。政策評価やサービスの評価を実施する際にランダム化比較試験は費用や倫理的問題の観点から実施が難しい場合がある。そのような場合の代替手段として、 過去に自然に発生した介入・非介入を分けるイベントを利用してランダム化比較試験を擬似的に再現することが考えられる。このようなイベントのことを自然実験という。

自然実験の例

全寮制学校の同室者の割り当て

成績に対するPeer Effect(周囲の人間の影響)を調査するために Zimmerman(2003) では全寮制高校における同室者の割り当てが入学時のSAT成績に対してランダムに決定されること に着目し、この割り当てを自然実験とみなして本人と同室者の入学時のSAT成績と卒業時のGPAの関係を分析することで成績に対してのPeer Effectを推定している。

アルゴリズムによる広告表示の割り当て

ユーザーにある商品広告を表示するかどうかについて、ユーザーの特徴量を利用した購入確率を予測するアルゴリズムによって決定するような状況を考える。 購入確率が0.8以上なら表示し、0.8未満なら表示しないというような割り当てがシステム上で行われているとしよう。 そうすると、購入確率が0.8001のユーザーと0.7999のユーザーはほとんど同じ特徴量を持っていると考えられるが、広告の表示について異なる割り当てを受けることになる。 したがって、予測値が0.8付近のユーザーのデータについてはRCTとみなせるような状況だと考えられる。あとから広告の購買効果について評価したい場合に、このイベントを自然実験として利用することが考えられる。

ランダム化比較試験, 自然実験を用いた研究, 観察研究の違い

実験者による統制のレベルの順でランダム化比較試験 > 自然実験を用いた研究 > 観察研究 となる。

以下の表は Natural Experiments: An Overview of Methods, Approaches, and Contributions to Public Health Intervention Research のTable1を翻訳したものである。

手法 介入が矛盾なく定義されている(well-defined)か 介入はどのように割り当てられるか 交絡因子を除去する実験デザインになっているか すべてのユニットは介入を受ける可能性があるか
ランダム化比較試験 研究プロトコルで明確に定義された介入 割当は研究チームの管理下で、各ユニットはランダムに介入群とコントロール群に分けられる。 ランダム化によって、期待値の意味で交絡はな無くなるが、共変量の不均衡は偶然発生しうる。 ランダム化によって、どのユニットも処置かコントロールの条件を受ける既知の確率を持つ。
自然実験を用いた研究 明確に特定された介入のもとで定義されているが、 コンプライアンス1、服薬量などは不明 割当は研究チームの管理下にはない。割当のプロセスの知識により、選択的暴露による交絡に対処することができる。 交絡は介入に対する選択的暴露によるもので、実験デザインとと解析の組み合わせによって対処しなければならない。 暴露確率は不明で、検証すべき。例えば、回帰不連続デザインは外挿に依存しているが、不連続境界上でユニットが処置と非処置のどちらか一方を受けることを仮定している。
観察研究 明確な介入の定義はないが、暴露レベルの比較の根底にある仮説的な介入がありうる。 たいてい、明確に定義された介入は存在せず、逆の因果関係(つまり、健康アウトカムが研究対象の暴露の原因である可能性がある)や交絡の可能性がある 交絡は暴露とアウトカムの共通の原因で、部分的には、統計的調整によって対処できる。しかしながら、残存交絡因子が存在する可能性が高い。 観察研究では暴露確率はほとんど考慮されず、明確に対処しない限り外挿のリスクがある。

参考文献

  1. 対象が介入を受け入れやすいかどうかが、交絡を引き起こしうるような状況のことを指している。