Spatiaalinen autokorrelaatio
Spatiaalinen autokorrelaatio [1] on tilastotieteessä ja todennäköisyyslaskennassa stokastisissa prosesseissa eräs autokorrelaation muoto. Kun prosessin satunnaismuuttujat indeksoidaan avaruuden pisteillä, saadaan satunnaiskenttä, jossa satunnaismuuttujat ovat sidoksissa toisiinsa geometrisesti. Satunnaiskentät ovat siis spatiaalisia stokastisia prosesseja. Satunnaiskentässä satunnaismuuttujien väliset riippuvuudet vaikuttavat merkittävästi niiden yhteisjakaumaan ja siksi riippuvuusfunktiot näyttelevät stokastisten prosessien teoriassa merkittävää osaa. Autokorrelaation tärkein käyttömuoto on hyödyntää tietoa riippuvuudesta kentän tietojen estimoinnissa tai arvojen interpoloinnissa.[2][3]
Satunnaismuuttujien välinen riippuvuus
[muokkaa | muokkaa wikitekstiä]Maantieteellisissä ilmiöissä mitattavan suureen arvoissa ilmenee usein suurta samankaltaisuutta läheltä toisiaan otetuissa näytteissä ja vähän samankaltaisuutta kaukana toisistaan otetuissa näytteissä. Maantieteilijän Waldo Toblerin ensimmäinen maantieteellinen sääntö sanoo vapaasti suomennettuna, että ”Kaikki riippuu aina kaikesta muusta, mutta lähellä toisiaan olevat riippuvat enemmän kuin kaukana toisistaan olevat”. Niissä ilmiöissä, joita voidaan luontevasti kuvailla suureilla, voidaan riippuvuutta lähestyä matemaattisesti.[3]
Nimenä autokorrelaatio viittaa korreloimiseen itsensä kanssa. Sillä viitataan kentällä mitatun suureen näytteisiin, joiden arvot korreloivat näytteiden välisten etäisyyksien ollessa pienet. Kun tapahtuma tulkitaan todennäköisyyslaskennan välineillä, muuttuu tutkimuskenttä satunnaiskentäksi ja näytteet satunnaismuuttujiksi, joilla on paikkakoordinaatit ja todennäköisyysjakaumiensa tuottamat arvot. Autokorrelaatio tarkoittaa silloin satunnaiskenttän tai stokastisen prosessin sisällä olevien satunnaismuuttujien välisen riippuvuuden astetta. Aikasarjoissa, jotka ovat temporaalisia stokastisia prosesseja, riippuvuus on tavallisesti voimakasta ajallisesti lähekkäisissä satunnaismuuttujissa. Spatiaalinen riippuvuus on tavallisesti voimakasta maantieteellisesti tai avaruudellisesti lähekkäisissä satunnaismuuttujissa.[3]
Riippuvuutta ilmaistaan riippuvuusfunktioilla, joiden muuttujina ovat spatiaallisten pisteiden väliset etäisyydet ja suunnat (etäisyysvektorit ). Korrelogrammi ilmaisee korrelaation määrää etäisyysvektorin suhteen, kovarianssifunktio kovarianssin suuruutta ja variogrammi erotuksen varianssin suuruutta pisteiden välillä.
Autokorrelaation testaaminen
[muokkaa | muokkaa wikitekstiä]Vahvassa autokorrelaatiossa näytepisteiden tai sattunnaismuuttujien sijaintien ja näytteiden tai satunnaismuuttujien arvojen välillä on riippuvuussuhde. On yleistä, että esimerkiksi lähellä toisiaan olevissa pisteissä on samansuuruiset arvot. Satunnaisuus heikentää riippuvuuden määrää ja vaikeuttaa riippuvuuden havaitsemista. Onkin olemassa erilaisia testejä sille sisältääkö stokastinen prosessi autokorrelaatiota. Satunnaiskentän autokorrelaatiossa lasketaan eri etäisyyksillä sijaitseville satunnaismuuttujapareille erotukset, kovarianssien tai variogrammien arvot.[2]
Mantel-testi autokorrelaatiolle
[muokkaa | muokkaa wikitekstiä]Testissä verrataan avaruudellisesti jakautuneen näyteotoksen etäisyyksiä näytteiden arvojen erotuksiin . Jos etäisyys-erotus-pareilla on korkea Pearsonin korrelaatiokerroin, sisältää aineisto autokorrelaatiota. Korrelaatiokerrointa verrataan usein sekoitetun aineiston tuottamaan Pearsonin korrelaatiokertoimeen. Siinä arvot irrotetaan etäisyyksistään ja sekoitetaan sattumanvaraisesti. Näyteaineiston ja sekoitettujen aineistojen korrelaatiokerroimien eron tulee olla keskimäärin suuri, jotta autokorrelaatio olisi merkittävä. Erotuksen voi korvata erotuksen neliön puolikkaalla , joka on variogrammin estimointilauseke.[1]
Moranin I testi autokorrelaatiolle
[muokkaa | muokkaa wikitekstiä]Moranin I-testi muistuttaa korrelaatiokertoimen laskemista. Se lasketaan etäisyysluokittain annetun etäisyyden lähiympäristössä siten, että painokerroin on yksi, kun näyte kuuluu luokkaan, ja nolla, kun se ei kuulu luokkaan. Lopuksi osoittaja jaetaan painokertoimien summalla ja näytteiden varianssilla. Funktion laskukaava on [2]
Testi antaa tuloksia väliltä . Tulokset ovat positiivisia, kun riippuvuus on positiivista eli lähellä toisiaan olevien näytteiden suureen arvot ovat yleensä yhdessä suuria tai yhdessä pieniä. Tulokset ovat negatiivisia, kun riippuvuus on käänteistä eli lähellä toisiaan olevat arvot ovat yleensä erisuuruisia. Toinen näytteistä antaa korkeita arvoja, kun lähellä oleva toinen näyte antaa matalia arvoja. Jos tulos on nolla tai lähellä sitä, ei riippuvuutta eli autokorrelaatiota esiinny.[3]
Muita testejä
[muokkaa | muokkaa wikitekstiä]Muitakin testejä on käytössä. Sellaisia ovat esimerkiksi Ripley'n K-testi ja Geary'n c-testi.[2][4]
Ilmiöitä
[muokkaa | muokkaa wikitekstiä]Spatiaalisen autokorrelaation aiheuttavia luonnon- tai yhteiskunnan ilmiöitä on monenlaisia. Alla olevassa luettelossa on tyypillisiä esimerkkejä:
- talojen ostohinnat samantyyppisten talojen välillä tietyn kaupunkialueen sisällä ovat yleensä yhtä korkeita [5]
- Länsi-Niilin virus leviää kantajalta toiselle lyhyitä matkoja lentävien hyttysten välityksellä [5]
- malmiossa olevan louhittavan mineraalin pitoisuusvaihtelut kallioperässä muotoutuivat sulan kivimassa aikanan osittain diffuusion vaikutuksesta [5]
- säärintaman aiheuttaman yhtenäisen säätilan muutokset liikkumisensa seurauksena ja sen vaikutukset paikalliseen säähän [5]
Kirjallisuutta
[muokkaa | muokkaa wikitekstiä]- Haining, R.: Spatial data analysis in the social and environmental sciences (409 sivua), Cambridge, Cambridge University Press, 1990
- Manly, B. F. J.: Statistics for Environmental Science and Management (326 sivua), Boca Raton, Chapman & Hall, 2001
- Upton, G. & Fingleton, B.: Spatial Data Analysis by Example, Volume 1: Point Pattern and Quantitative Data (410 sivua), Norwich, John Wiley & Sons Ltd, 1985
- Fortin, Marie-Josee, M. Dale and J. Hoeff: Spatial Analysis in Ecology. Encyclopedia of Environmetrics, 4: s. 2051-2058, 2002
Katso myös
[muokkaa | muokkaa wikitekstiä]Lähteet
[muokkaa | muokkaa wikitekstiä]- Griffith, D.A.: Spatial Autocorrelation, Texasin yliopisto Dallasissa, USA, 2009
Viitteet
[muokkaa | muokkaa wikitekstiä]- ↑ a b Horttanainen, Esa-Pekka: Mat-2.108 Sovelletun matematiikan erikoistyö Spatiaalisen autokorrelaation testaaminen, Systeemianalyysin opinnäytetyö, Aalto-yliopisto, 2003
- ↑ a b c d Zuur, Andrea: Spatial Autocorrelation
- ↑ a b c d Griffith, D.A.: Spatial Autocorrelation], 2009, s.1
- ↑ Archbald, Gavin: Spatial Statistics: An Overview of Uses
- ↑ a b c d Griffith, D.A.: Spatial Autocorrelation], 2009, s.2–3
Aiheesta muualla
[muokkaa | muokkaa wikitekstiä]- ArcGIS: How Spatial Autocorrelation (Global Moran's I) works
- GEOB 479: Spatial Autocorrelation
- Briggs: Spatial Autocorrelation: The Single Most Important Concept in Geography and GIS! (Power Point-esitys)
- Carl, G. & Kühn, I.: Analyzing spatial autocorrelation in species distributions using Gaussian and logit models, 2007