Regresión Discontinua

ES | EN

La Regresión Discontinua (RD) es un diseño cuasi-experimental que permite identificar efectos causales bajo ciertos supuestos de continuidad. Considere una población de unidades indexadas por \( i = 1, \dots, N \), cada una con un valor en una variable continua denominada "score" o variable de asignación, denotada por \( X_i \). Existe un umbral \( c \) tal que las unidades con \( X_i \geq c \) reciben el tratamiento (denotado por \( D_i = 1 \)), mientras que aquellas con \( X_i < c \) no lo reciben (\( D_i = 0 \)).

El objetivo es estimar el efecto causal del tratamiento sobre un resultado \( Y_i \). Bajo el supuesto de que las funciones condicionales de esperanza de los potenciales resultados sin tratamiento, \( Y_i(0) \), y con tratamiento, \( Y_i(1) \), sean continuas en \( c \), la diferencia en el límite cuando \( X_i \) tiende al umbral desde la izquierda y desde la derecha identifica el efecto del tratamiento en el umbral. Formalmente, si suponemos que:

\[ \lim_{x \to c^-} \mathbb{E}[Y_i(0) \mid X_i = x] \quad \text{y} \quad \lim_{x \to c^+} \mathbb{E}[Y_i(1) \mid X_i = x] \]

están bien definidas y las funciones de esperanza de los resultados sin tratamiento y con tratamiento son continuas en el punto \( c \), entonces el efecto causal local (LATE, por sus siglas en inglés) viene dado por:

\[ \tau_{\text{RD}} = \lim_{x \to c^+} \mathbb{E}[Y_i \mid X_i = x] - \lim_{x \to c^-} \mathbb{E}[Y_i \mid X_i = x]. \]

En otras palabras, la RD asume que, salvo por la asignación al tratamiento, las unidades inmediatamente a la izquierda y a la derecha del umbral son comparables en todas las características observables y no observables. Por ello, la discontinuidad en la esperanza del resultado justo en el umbral se interpreta como el efecto causal del tratamiento para las unidades con \( X_i = c \).

Este panel interactivo te permite simular datos generados bajo un diseño RD. Al modificar parámetros tales como el número de observaciones, el valor del tratamiento, el umbral \( c \), la pendiente subyacente y la desviación estándar del error, así como el "entorno" (el rango alrededor del umbral utilizado para la estimación), podrás visualizar cómo cambian las estimaciones del efecto y la precisión estadística. Un entorno más amplio provee más datos pero puede introducir sesgo si la relación subyacente no es adecuadamente modelada, mientras que un entorno muy reducido minimiza sesgos al costo de aumentar la varianza del estimador.



Variable de Resultado por Puntaje de Asignación


Variación del Efecto del Tratamiento y Número de Observaciones por Entorno