Rubin Causal model
Einfache Sprache
Basiert auf der Idee von potential outcomes. Also das Gedankenexperiment das es zwei Universen gibt, welche sich nur durch eine treatment Variable unterscheiden. Der kausale Effekt der treatment Variable ist dann die Differenz der potential outcomes. Das ist so aber unmöglich zu messen. Daher geht es darum eine möglichst gute Approximation des counterfactual (das nicht observierte outcome) zu generieren.
Der Effekt von Olivenöl auf Lebenserwartung?
Seien $A$ und $B$ zwei parallele Universen. Das Individuum $i$ in $A$ konsumiert $10g$ Olivenöl pro Tag und wird $85$ Jahre alt. Das Individuum $i$ in $B$ konsumiert kein Olivenöl und wird $80$ Jahre alt. Was ist der kausale Effekt von $10g$ Olivenöl pro Tag? $85-80 = 5$ Jahre.
Wichtige Definitionen
Sei $i$ eine individuelle Beobachtungsobjekt, z.B. ein Person. Die binäre Variable $D_i$ bestimmt den tatsächlichen Behandlungsstatus von $i$, also die Zuteilung in Behandlungs bzw. Kontrollgruppe:
$$D_i=\begin{cases}1& \text{Beobachtung $i$ ist Teil der Behandlungsgruppe.}\\ 0&\text{Beobachtung $i$ ist Teil der Kontrollgruppe.}\end{cases}$$Potentiellen Ergebnisse
Das potentiellen Ergebnisse (potential outcomes) $Y_i^j$,wobei $j$ definiert durch
$$j=\begin{cases}1& \text{falls $i$ behandelt werden würde.}\\ 0&\text{falls $i$ \textbf{nicht} behandelt werden würde}.\end{cases}$$, ist die das Ergebnis unabhängig von dem tatsächlich Behandlungsstatus für beide Fälle. Also das Ergebnis von $i$ wenn er behandelt würde und nicht.
Individuelle Behandlungseffekt
Def. Individuelle Behandlungseffekt $\delta_i$
Der Individuelle Behandlungseffekt (individual treatment effect) $\delta_i$ ist definiert durch $\delta_i = Y_i^1-Y_i^0$. Beachte das dieser sich nicht berechenbar ist, da sich die Messung beider Ereignisse gegenseitig ausschießt (siehe Fundamental problem of causal inference)
Tatsächliches Ergebnis
Def. Tatsächliches Ergebnis $Y_i$
Das tatsächliche Ergebnis für $i$ ist bestimmt durch den tatsächlichen Behandlungsstatus $D_i$ und den potenziellen Ereignissen $Y_i^j$ durch
$$Y_i = D_iY_i^1+(1-D_i)Y_i^0 = \begin{cases}Y_i^1 & \text{falls } D_i = 1\\ Y_i^0 & \text{falls } D_i = 0\end{cases}$$
ATE
Def. ATE $E[\delta_i]$
Der Durchschnittlicher Behandlungseffekt (average treatment effect (ATE)) $E[\delta_i]$ ist der Mittelwert der Individuelle Behandlungseffekt über alle $i$. D.h.
$$E[\delta_i] = E[Y_i^1-Y_i^0] = E[Y_i^1]-E[Y_i^0]\;.$$
ATT
Def. ATT $E[\delta_i|D_i = 1]$
Der Durchschnittlicher Behandlungseffekt der Behandelten(average treatment effect of the treated (ATT)) $E[\delta_i|D_i = 1]$ ist der Mittelwert der Individuelle Behandlungseffekt über alle $i$ die behandelt wurden. D.h.
$$E[\delta_i|D_i = 1] = E[Y_i^1-Y_i^0|D_i = 1] = E[Y_i^1|D_i = 1]-E[Y_i^0|D_i = 1]\;.$$
ATU
Def. ATU $E[\delta_i|D_i = 0]$
Der Durchschnittlicher Behandlungseffekt der nicht Behandelten (average treatment effect of the untreated (ATU)) $E[\delta_i|D_i = 0]$ ist der Mittelwert der Individuelle Behandlungseffekt über alle $i$ die nicht behandelt wurden. D.h.
$$E[\delta_i|D_i = 0] = E[Y_i^1-Y_i^0|D_i = 0] = E[Y_i^1|D_i = 0]-E[Y_i^0|D_i = 0]\;.$$
LATE
Def. LATE
Im Kontext von IV ist der Local Average Treatment Effect (LATE) der ATE aber nur für die Individuen $j$, dessen Behandlungsstatus $D_j$ sich wegen dem Instrument verändert hat. $j$ werden compliers genannt.
Fundamental problem of causal inference
Def. Fundamental problem of causal inference
Es ist unmöglich $Y_i^1$ und $Y_i^0$ zu messen. Daher ist $\delta_i$ unmessbar.
SUTVA
Die Stable Unit-Treatment Value Assumption bedeutet das der ATE folgende Annahme trift:
- Homogene Dosierung der Behandlung (für alle gleich)
- potentiellen Ergebnissen sind gleich egal wer sonst bzw. wie viele behandelt werden
- Partielles Equilibrium