Regressioepäjatkuvuusasetelma

Regressioepäjatkuvuusasetelma (RDD) on kvasikokeellinen tutkimusmenetelmä, jossa kausaalisia vaikutuksia päätellään. Niissä on raja-arvo, jonka ylittäviin (tai alittaviin) kohteisiin suoritetaan interventio. Kun verrataan hyvin lähellä rajaa olevia tapauksia toisiinsa, voidaan arvioida intervention vaikutusta, vaikka intervention kohteeksi joutumista ei ole voitu satunnaistaa. Ensimmäisenä tällaisen kokeen tekivät Donald Thistlethwaite ja Donald Campbell arvioidessaan stipendiohjelmia,^[1] RDD:stä on tullut yhä suositumpi viime vuosina.^[2]

Näin saadaan estettyä vinoutunut otos sellaisissakin tilanteissa, joissa satunnaistettu vertailukoe olisi epäeettinen, vaikea tai kallis, siis esimerkiksi stipendien jakaminen arpomalla.

Esimerkki

Suomessa RDD:tä on sovellettu esimerkiksi tutkimuksessa, jossa selvitettiin eliittilukioiden vaikutuksia ylioppilaskirjoitusten tuloksiin.^[3] Tutkimuksessa verrattiin keskenään niitä oppilaita, jotka juuri ja juuri alittivat tai ylittivät kuhunkin tarkasteltavana olleeseen lukioon vaaditun keskiarvorajan. Oppilaat olivat siis lähtökohtaisesti opintomenestykseltään hyvin samankaltaisia, mutta osa heistä pääsi sisään niin kutsuttuun eliittilukioon ja osa ei. Tutkimus osoitti, että eliittilukiossa opiskelulla ei ollut vaikutusta menestykseen ylioppilaskirjoituksissa tarkasteltujen oppilaiden tapauksissa.

Menetelmät

Yleensä käytetään ei-parametristä tai parametristä regressiota.

Ei-parametrinen estimointi

Yleisin ei-parametrinen menetelmä käyttää RDD yhteydessä on paikallinen lineaarinen regressio. Tämä on muotoa:

Y=\alpha +\tau D+\beta _{1}(X-c)+\beta _{2}D(X-c)+\varepsilon ,

missä $c$ on käsittelyn raja-arvo, esimerkiksi lukion keskiarvoraja. $D$ on binaarinen muuttuja, joka on yksi, jos keskiarvo $X\geq c$ . Vakio $h$ kertoo, miten kaukana $c$ :stä olevat keskiarvot otetaan mukaan tutkimukseen: $c-h\leq X\leq c+h$ . Termit $\beta _{1}(X-c)+\beta _{2}D(X-c)$ ottavat huomioon keskiarvon suoran vaikutuksen. Yleensä käytetään kolmiomaista ydintä^[4], mutta suorakaiteen muotoinen ydin on suoraviivaisemmin tulkittavissa.^[5]

Parametrinen estimointi

Esimerkki parametrisesta estimoinnista on:

Y=\alpha +\beta _{1}x_{i}+\beta _{2}c_{i}+\beta _{3}c_{i}^{2}+\beta _{4}c_{i}^{3}+\varepsilon ,

where

x_{i}={\begin{cases}1{\text{ if }}c_{i}\geq {\bar {c}}\\0{\text{ if }}c_{i}<{\bar {c}}\end{cases}}

ja ${\bar {c}}$ on kokeen raja-arvo (esim. lukion keskiarvoraja). Huomaa, että polynomiosaa voidaan lyhentää tai pidentää tarpeen mukaan.

Muita esimerkkejä

Politiikka, jossa kokeen kohteeksi joutuminen määräytyy iän perusteella (esim. eläkkeet tai alkoholin minimi-ikäraja).
Vaaleissa, joissa poliitikko voittaa juuri ja juuri tulee valituksi.

Vaadittavat oletukset

Regressio-epäjatkuvuusasetelma olettaa, että valintarajan lähellä valikoituminen on "yhtä hyvää kuin satunnainen". Tätä voi testata monin tavoin.

Lähteet

↑ Thistlethwaite, Campbell D.: Regression-Discontinuity Analysis: An alternative to the ex post facto experiment. Journal of Educational Psychology, 1960, 51. vsk, nro 6, s. 309–317. doi:10.1037/h0044319
↑ Imbens ja Wooldridge: Recent Developments in the Econometrics of Program Evaluation. Journal of Economic Literature, 2009, 47. vsk, nro 1, s. 5–86. doi:10.1257/jel.47.1.5
↑ Tervonen, Kortelainen ja Kanninen: Eliittilukioiden vaikutukset ylioppilaskirjoitusten tuloksiin. VATT Tutkimukset 186/2017.
↑ Fan ja Gijbels: Local Polynomial Modelling and Its Applications. Chapman and Hall, 1996. ISBN 0-412-98321-4
↑ Lee ja Lemieux: Regression Discontinuity Designs in Economics. Journal of Economic Literature, 2010, 48. vsk, nro 2, s. 281–355. doi:10.1257/jel.48.2.281

[Thistlethwaite_and_Cambpell-1] Thistlethwaite, Campbell D.: Regression-Discontinuity Analysis: An alternative to the ex post facto experiment. Journal of Educational Psychology, 1960, 51. vsk, nro 6, s. 309–317. doi:10.1037/h0044319

[Imbens_and_Lemieux-2] Imbens ja Wooldridge: Recent Developments in the Econometrics of Program Evaluation. Journal of Economic Literature, 2009, 47. vsk, nro 1, s. 5–86. doi:10.1257/jel.47.1.5

[3] Tervonen, Kortelainen ja Kanninen: Eliittilukioiden vaikutukset ylioppilaskirjoitusten tuloksiin. VATT Tutkimukset 186/2017.

[Fan_and_Gijbels_1996-4] Fan ja Gijbels: Local Polynomial Modelling and Its Applications. Chapman and Hall, 1996. ISBN 0-412-98321-4

[Lee_and_Lemieux_2010-5] Lee ja Lemieux: Regression Discontinuity Designs in Economics. Journal of Economic Literature, 2010, 48. vsk, nro 2, s. 281–355. doi:10.1257/jel.48.2.281

[1]

[2]

[3]

[4]

[5]