Instrumenttimuuttuja

Wikipediasta
Siirry navigaatioon Siirry hakuun

Instrumenttimuuttuja on tilastotieteessä muuttuja, jota käytetään regressioanalyysissa apuna kun selittävät muuttujat ovat korreloituneita mallin virhetermin kanssa. Tämä korrelaatio voi johtua selittävien muuttujien endogeenisuudestä, puuttumisesta tai mittausvirheestä. Näissä tapauksissa tavallinen lineaarinen regressioanalyysi tuottaa harhaisia sekä tarkentumattomia estimaatteja. Toimivan instrumenttimuuttujan avulla on mahdollista saada tarkentuva estimaatti. Matemaattisesti lausuen instrumenttimuuttujaa voi auttaa ratkaisemaan virhetermin u kanssa korreloivan selittävän muuttujan x ongelman, eli kun Cov(x,u) ≠ 0[1]. Virhetermin kanssa korreloivaa selittäjää kutsutaan endogeeniseksi muuttujaksi[2].

Instrumenttimuuttujan tärkeimmät ominaisuudet ovat:

  • Instrumentti z on riittävän vahvasti korreloitunut mallin selittävän muuttujan x kanssa, eli Cov(z,x) ≠ 0[1]. Hyvin x:n kanssa korreloivaa instrumenttimuuttujaa kutsutaan relevantiksi, vain vähän korreloivaa heikoksi. Yleinen testi instrumentin relevanssille on F-testisuure x:n suhteen: jos F-testisuure on yli 10, instrumenttia voi tavallisesti pitää relevanttina[2]. Korrelaation voi selvittää myös regressioanalyysillä, jossa testataan x:n ja z:n välinen korrelaatio[1].
  • Instrumentti ei saa olla korreloitunut mallin virhetermin u kanssa, eli sillä ei saa olla samaa ongelmaa kuin alkuperäisellä muuttujalla, Cov(z,u) = 0[1]. Toisin sanoen sen tulee olla eksogeeninen[2]. Instrumentin eksogeenisuudelle ei ole olemassa yleistä testiä, vaan eksogeenisuus perustellaan päättelyllä. Kuitenkin, jos tarjolla on useita vaihtoehtoisia instrumentteja, niiden eksogeenisuuden astetta voi arvioida homoskedastisuusrajoitteisella F-testisuureella eli J-testisuureella[2].
  • Instrumentti ei saa kuulua itse malliin eli sen tulee vaikuttaa selitettävään muuttujaan vain selittävän muuttujan kautta.

Instrumenttimuuttujaestimaattori lasketaan tavallisesti kaksivaiheisen pienimmän neliösumman menetelmän avulla (engl. two stage least squares, 2SLS). Tällöin ensimmäisessä vaiheessa mallin jokainen endogeeninen selittävä muuttuja regressoidaan kaikilla soveltuvilla instrumenteilla sekä eksogeenisilla selittävillä muuttujilla. Toisessa vaiheessa alkuperäinen malli estimoidaan käyttäen selittäjinä eksogeenisia muuttujia sekä ensimmäisestä vaiheesta saatuja endogeenisten muuttujien ennusteita.

Instrumenttimuuttujat saattavat olla varsin yllättäviä. Instrumenttimuuttujaa käytti ensimmäisen kerran Philip G. Wright, joka tunnetaan parhaiten erinomaisesta kasvi- ja eläinperäisten öljyjen tuotannon, kuljetuksen ja myynnin kuvauksestaan 1900-luvun alkupuolen Yhdysvalloissa.

Wright yritti selvittää voin kysyntää ja tarjontaa paneeliaineistolla hinnoista ja myydyistä määristä Yhdysvalloissa. Ajatus oli, että regressioanalyysillä voisi tuottaa kysyntä- tai tarjontakäyrän, koska ne muodostuvat hintojen ja kysyttyjen tai tarjottujen määrien muodostamasta urasta. Ongelmana oli, että havaintoaineisto ei muodostanut kysyntä- eikä tarjontakäyrää sellaisenaan, vaan pikemminkin pistehavaintojen pilven, jossa oli erimuotoisten kysyntä- ja tarjontakäyrien kohtaamispisteitä eri markkinatilanteissa. Aineistosta ei tuntunut saavan otetta.

Ongelmana oli, että hinta vaikutti sekä kysyntään että tarjontaan, joten vain toista kuvaavaa funktiota ei voinut muodostaa suoraan havaintoaineistosta. Wright päätteli oikein, että hän tarvitsi muuttujan, joka korreloi joko kysynnän tai tarjonnan kanssa, mutta ei molempien, toisin kuin tuotantomäärät suoraan - siis instrumenttimuuttujan.

Pitkän pohdinnan jälkeen Wright päättyi käyttämään alueellisia sademääriä: hän päätteli, että sademäärä vaikutti ruohon tuotantoon ja siten maidon tuotantoon ja lopulta voin tarjontaan, mutta ei voin kysyntään. Näin hän onnistui muodostamaan regressioyhtälön, jossa oli mukana vain hinta ja tarjonnan instrumenttimuuttuja, eli sademäärät, ja sai kuin saikin määritettyä voille tarjontakäyrän.[2]

  1. a b c d Wooldridge, J.: Introductory Econometrics. South-Western, Scarborough, Kanada, 2009.
  2. a b c d e Stock, J. & Watson, M.: Introduction to Econometrics. Pearson, Boston, 2007.