Mitkä tekijät johtavat demokratiaan? Seuraako vauraus demokratisoitumisesta vaiko demokratia vauraudesta? Demokratia ja demokratisoituminen ovat poliittisen tutkimuksen klassikkokysymyksiä. En ota kantaa siihen loputtomaan suohon, mikä on demokratian määrittely käsitteenä. Sen sijaan keskityn jälkimmäiseen; mitkä tekijät edesauttavat demokratisoitumista?
Perinteisesti demokratian juurtumista on selitetty valtion vauraudella, talousjärjetelmällä, kulttuuriperinteillä, poliittisen osallistumiskulttuurin perinteillä ja, myös, kansainvälisellä painostuksella (eli demokratia-ristiretkillä a la Irakin sota). Keskityn näistä ensimmäiseen, lisäten soppaan myös yhteiskunnan sosiaalisen kehityksen mittareita. Kuten kaikessa muussakin tilastotieteellisessä
toiminnassa, syy-seuraussuhteiden tulkinnan kanssa pitää muistaa olla
tarkka. Itse kuulun koulukuntaan, jonka mukaan demokraattinen
järjestelmä vähintään yhtä paljon aiheuttaa kuin seuraa taloudellista hyvinvointia (yhtä kirjaa suositellakseni, Daron Acemoglun ja James
Robinsonin Why Nations Fail on erinomainen katsaus aiheeseen). Menemättä sen syvällisemmin aiheen loputtomaan kirjallisuuteen ja teoriaan, siirrytään aineistoon ja menetelmiin. Eihän ketään kiinnosta lukea nälkävuoden mittaisia blogitekstejä tänä hektisenä Internet-aikakautena kun ei ehdi pitkiä kalsareitakaan käyttämään.
Demokratian mittarina käytän The Economistin koostamaa demokratiaindeksiä, joka on mielestäni tarpeeksi validi numeerinen mittari ikiaikaiselle ongelmakysymykselle. Selittävät muuttujat löytyvät Maailmanpankin tietovarastosta, joka kattaa todella laajan skaalan erilaisia kehityksen indikaattoreita. Demokratiaindeksin viitevuotena on 2014 ja Maailmanpankin indikaattoreiden 2013, lähinnä koska 2014 on vielä niin vajavainen tiedoiltaan. Lähinnä omaan fiilikseen ja sattumaan perustuvalla otantamenetelmällä vailla suurempia teoreettisia perusteita ja hypoteeseja selittäviksi muuttujiksi valikoitui eliniänodote, alaikäisten tyttöjen suorittamien synnytysten aste, netinkäytön kattavuus, kaupungistumisaste, kansalaisten tulotaso, puolustusmenojen osuus BKT:sta, maatalouden arvonlisäyksen osuus BKT:sta, asumistiheys, kaupungistumisaste ja aika, joka kuluu yrityksen perustamiseen.(muitakin muuttujia valittiin, mutta niissä puuttuvien arvojen osuus oli liian iso). Muuttujat ovat mukana sekä kategorisina, että muokkaamattomina numeerisina eri päätöspolkutekniikoiden havainnollistamiseksi.
Kun siivosin datasta valtioryhmittymät, kuten EU:n, sekä puuttuvia havaintoja jossain muuttujassa omaavat tapaukset, jäljelle jäi 110 valtiota. (suuri filosofinen kysymys on, että mitä puuttuville havainnoille pitäisi tehdä, imputoida, poistaa vai olla huomioimatta? Valitsin helpoimman reitin poistamalla ne, sillä aineiston koko jäi silti tarvittavan isoksi)
Ja sitten lyhyesti menetelmästä. Päätöspuut ovat joukko algoritmejä, joilla luodaan puun kaltaisia polkuja tarkoituksena luokitella tai estimoida vastemuuttujaa. Päätöspuut pyrkivät jakamaan aineistoa vastemuuttujan suhteen mahdollisimman homogeenisiin ryhmiin aloittaen tilanteesta, jossa kaikki tapaukset ovat yhdessä ryhmässä. Tämän jälkeen tehdään jako kahteen polkuun, joka mahdollisimman suuresti erottaa vastemuuttujan arvot kahtia. Tätä jatketaan kunnes päätöspuu ei voi enää kasvaa (yleensä, koska se törmää ennalta määrättyyn parametriin, joka estää puun kasvamisen liian monimutkaiseksi). No, esimerkillä tämä selviää parhaiten.
Yllä on ensimmäinen päätöspuu. Siinä vastemuuttuja on luokiteltu kahteen ryhmään, demokraattisiin ja autoritäärisiin valtioihin (poikkipisteenä demokratiaindeksin arvo 6, joka on jakopiste puutteellisten demokratioiden ja hybridiregiimien välillä The Economistin luokittelua käyttäen). Selittävät muuttujat on jaettu R:n omaa algoritmiä hyödyntäen kolmeen luokkaan, jotka nimetty alhaiseksi, normaaliksi ja korkeaksi.
Näemme, että jos maatalouden arvonlisäyksen osuus bruttokansantuotteesta on normaali tai korkea, valtio on hyvin suurella todennäköisyydellä autoritäärinen (polun päässä on 21 autoritääristä ja 2 demokraattista valtiota). Tämä vaikuttaa selkeältä päätössäännöltä. Sen sijaan jos maatalouden arvonlisäyksen osuus on alhainen, tarvitsemme vielä joukon lisäsääntöjä luokittelun tueksi. Korkean netinkäytön kattavuuden maat ovat suurelta osin demokraattisia valtioita eli vielä tässä vaiheessa meillä on selkeähkö sääntö demokraattisten valtioiden seulomiseksi: alhainen maatalous ja korkea digitalisoituminen ovat merkkejä demokraattisesti valtiosta.
Tämän jälkeen päätösten laatu heikkenee ja puu tulee monimutkaisemmaksi. Huomaamme, että luokkien jakolinjat eivät ole enää niin selkeitä. Alhaisen maatalouden, alhaisen tai normaalin netinkäytön ja alhaisen kaupungistumisasteen valtioista löytyy 6 autoritäärisestä ja 3 demokraattista valtiota. Lopullinen puu ei ole lopulta helppokäyttöisin tai intuitiivisinkaan; kaupungistumisaste esiintyy kahdesti jakaen ensin alhaisen kaupungisasteen valtiot autoritäärisiksi, mutta parin oksan päässä korkea kaupungistumisaste onkin hieman enemmän autoritäärisen valtion merkki. Mielenkiintoisen detaljina on teinisyntyvyys, jonka normaalit tai korkeat arvot itse asiassa viittavat demokraattisiin yhteiskuntiin.
Numeeristen muuttujien kategorisoinnissa menetetään aina informaatioarvoa. Erityisesti näin kävi muutaman epätasaisen jakauman omaavan muuttujan kanssa; esim. puolustusmenojen kohdalla 2 valtiota luokiteltiin normaalin ja 1 korkean puolustusmenojen valtioksi. Näin voi käydä, jos luottaa liikaa automaattiseen luokitteluun tutkimatta itse jakaumia.
Päätöspuut ovat kuitenkin siitä mukavia ja ketteriä menetelmiä, että sekä niiden selitettävät, että selittävät muuttujat voivat olla sekä kategorisia, että numeerisia. Seuraavaksi suoritan regressiopuun, jossa demokratiaindeksi toimii vastemuuttujana.
Jos siis valtiossa eliniänodote on yli 78, pääsemme varsin demokraattisiin yhteiskuntiin. Lisätarkkuutta saamme vielä katsomalla kansalaisten keskimääräistä tulotasoa, jossa 37 000 dollaria on se maaginen raja todella toimivien demokratioiden (9) ja hieman vajavaisten (7,6) välillä. Mutta demokraattiseksi valtioksi, tosin hieman puutteelliseksi, voi tämän päätöspuun mukaan päästä myös valtiot, joissa ihmiset eivät ihan keskimäärin yllä 78 vuoden ikään. Tarvitsee vain olla pienemmät puolustusmenot kuin 3,5 % BKT:sta, maatalouden arvonlisän osuuden olevan alhaisempi kuin 18 % BKT:stä ja eliniän odotteen olevan silti yli 73 vuotta. Kaikista autoritäärisimmät yhteiskunnat keskittyvät armeijaan kuluttamiseen, maatalouteen ja olemaan köyhiä.
Nyt olemme luoneet sekä luokittelevan, että estimoivan mallin (joka tässä tapauksessa kuitenkin voitaneen laskea myös luokittelevaksi, sillä demokratiaindeksin arvoilla on selkeä The Economistilta tuleva luokitteleva tulkinta). Viimeisessä mallissa yhdistän vastemuuttujan yksinkertaistamisen ja selittävien muuttujien täyden informaation. Katsotaan kuinka selitysvoimainen puu saadaan aikaan.
(tällä kertaa bokseissa on valtioiden lukumäärien sijaan todennäköisyydet)
Varsin yksinkertainen siis. Jos maatalouden arvonlisän osuus BKT:stä on yli 9,3 prosenttia, valtio on 80 prosentin todennäköisyydellä autoritäärinen. Jos valtio ei elä maataloudesta niin puolustusmenojen osuuden ollessa yli 3,2 prosenttia BKT:stä niin voimme samalla varmuudella päätellä valtion olevan autoritäärinen. Jos kumpikaan näistä ei toteudu, valtio on hyvin todennäköisesti ihan suht kiva paikka asua. Tai ainakin demokraattinen.
Käytännön bisnesmaailman sovelluksissa tällainen puu olisi varmasti ideaali: sen luokitteleva ja ennustava voima on suuri, mutta se on myös tulkinnallisesti hyvin yksinkertainen. Seuraavan kerran kun mietitte turistikohteenne poliittista järjestelmää, katsokaa vain sen maataloussektorin kokoa ja puolustusmenoja.
Blogipostauksen pituus alkaa jo lähestyä aivan liian monimutkaista päätöspuuta, joten on loppupäätelmien aika. Maatalousvaltaiset valtiot ovat yhteiskunnallisesti yksinkertaisempia ja kehittymättömämpiä, joissa todennäköisemmin valtaa pitää paikalliset päälliköt, kuin keskushallinto. Sosiologisesti voisi vielä pohtia maanviljelijöiden olevan työväenluokkaa perinteisesti konservatiivisempaa sakkia, joihin harva muutosliike on pohjautunut. Puolustusmenot ovat taas selkeästi seuraus eikä syy valtioiden autoritäärisyydelle; kun vallalla ei ole legitimiteettiä ja kansan hyväksyntää on vallassa pysymisen perustuttava voimankäyttöön. Korkea tuloaste ja netinkäytön levinneisyys tuskin yllättävät, mutta oliko muna ennen kanaa?
Demokratian syy-seuraussuhteista emme varmaan oppineet mitään uutta. Tilastolliset menetelmät kertovat suhteista, mutta eivät kausaliteettisäännöistä. Tätä ei voi liikaa korostaa. Kausaliteetit ovat perusteltava teorialla. Mutta tästä aiheesta emme olisi oppineet kausaliteeteistä, vaikka sattumanvaraisuuden sijaan olisin varustanut itseni selkeillä teorioilla ja hypoteeseillä. Kyseessä on liian monitulkintainen ja monisyinen ilmiö yksisuuntaisten kausaliteettien johtamiselle.
Ei kommentteja:
Lähetä kommentti