lauantai 15. joulukuuta 2018

Eduskuntaäänestykset ja yksimielisyys

Suomi on perinteisesti tunnettu konsensus-hakuisesta politiikastaan, jossa karkeasti yleistäen harmaan eri sävyissä vaihtelevat puolueet tekevät yhteistyötä suurin piirten saman suuntaisten tavoitteiden eteen. Mutta Suomeenkin on rantautunut viime aikoina korostunut poliittinen polarisaatio; Pekka Haavistokin sai omiltaan täyslaidallisen kun ei kategorisesti suostunut sulkemaan pois (muutenkin äärimmäisen epätodennäköistä) hallitusyhteistyötä Perussuomalaisten kanssa. Isossa maailmassa USA: ssa demokraattien ja republikaanien välinen yhteistyö on käytännössä jo mahdotonta ja maa on jakautunut kahteen vihamieliseen leiriin, jossa jopa perinteinen vihollinen Venäjä voi alkaa näyttäytymään oman maan vastapuolta parempana vaihtoehtona.

Toinen äänestysten ennalta-arvattavuutta lisäävä tekijä on puoluekuri. Puoluekuria on usein demonisoitu Suomessa, koska se sitoo kansanedustajat kädet äänestämään mahdollisesti oman omatuntonsa vastaisesti. Toisaalta se on tärkeää eduskunnan jouhevalle toiminnalle ja tavallaan äänestysten ennustettavuuden parantumisen kautta myös lisää äänestäjien kuluttajan turvaa (niin kauan kuin äänestää ensisijaisesti puoluetta eikä ehdokasta, kuten Suomen järjestelmässä tulisi tehdä). Mutta puoluekuri on myös omiaan lisäämään eduskuntaäänestys äänijakauman polarisaatiota; joko koko puolue äänestää asian puolesta tai kukaan ei äänestä.

Joskus harvoin kuitenkin eduskuntaankin päätyy sellaisia aloitteita, jotka saavat yksimielisen tai liki yksimielisen tuen. Tarkoitukseni on tutkia, että voidaanko äänestyksen lopputulosta ennustaa aloitteen otsikon perusteella. Data on haettu Eduskunnan avoimen rajapinnan kautta, rajaten kysely suurin piirtein nykyiseen hallituskauteen alkaen vuodesta 2015 (kysely tehdään äänestysId:n avulla ja kerralla saa maksimissaan 100 tulosta). Lisäksi datasta otetaan vain suomenkieliset rivit mukaan. Lopullinen data sisältää 2550 äänestystulosta. Tekstidataa ei kummemmin esikäsitellä vaan se otetaan vastaan sellaisenaan.

Lasken jokaiselle äänestystulokselle "yhdenmukaisuusindeksin" kaavalla itseisarvo(jaa-äänet - ei-äänet - 0.5*tyhjä-äänet / jaa-äänet + ei-äänet + 0.5*tyhjä-äänet). Näin saadaan nollan ja ykkösen välillä arvoja saava muuttuja, jossa lähellä ykköstä olevat arvot tarkoittavat sitä, että suurin osa kansanedustajista äänesti joko jaa tai ei ja lähellä nollaa olevat arvot taas sitä, että äänestys oli tiukka ja jakautui lähes tasan jaa- ja ei-äänien kesken. Tyhjää äänestäneet arvotetaan vain puolikkaan ei-äänen-arvoiseksi, koska ne eivät kuvasta täyttä erimielisyyttä. Poissa-olevia ei huomioida. Indeksin keskiarvo on 0,44 ja mediaani 0,37. Tämä tarkoittaa sitä, että kun yhdenmielisyys löytyy, se löytyy kunnolla.

Teen vielä binäärisen kohdemuuttujan jakamalla yli 0.5 indeksin arvon saaneet "melko yksimielisiin" ja vastaavasti sen alle jääneet "melko erimielisiin" äänestystuloksiin. Tätä binääristä muuttujaa vasten rupean sitten ennustamaan.

Kuvio 1. Kaikkien aloitteiden otsikoiden sanapilvi

Rakensin sekä nykyisen tekoälyhypen taustalla olevan seksikkään syvän neuroverkkomallin, jossa oli kolme "piilotettua tasoa" (hidden layer) sekä perinteisemmän tukivektorikoneen (vaikkakin tosiasiassa neuroverkot kehitettiin kauan ennen tukivektorikoneita). Tällä kertaa neuroverkkomalli vei pidemmän korren, päätyen eri testeissä noin 0,72 AUC: in tasolle (malli ei ole siis erityisen maaginen, mutta aivan toivotonkaan). Käyttäen 0.39 rajana yhdenmielisten-luokkaan kuulumiselle, malli löytää 200 sadasta testiaineiston yhdenmielisestä lopputuloksesta lopulta 122, mutta toisaalta ennustaa siihen väärin 97 tapausta, kokonaistarkkuuden jääden maltilliseen 0,66.  Malli varmasti tarvitsisi sekä enemmän dataa, että myös varsinaisen aloitteen tekstisisällön, jotta pääsisimme aidosti hyviin tuloksiin.

Neuroverkosta emme saa mitenkään selville, että minkälaiset aloitteet sitten lopulta saavat koko eduskunnan tuen, enkä myöskään itse tehnyt sen enempää tutkivaa analytiikkaa asian selvittämiseksi. Alla on sanapilvi, kun data on rajoitettu vain yhdenmielisyys-indeksissä yli 0,8 arvon saaneisiin:


Kuvio 2. Varsin yksimieliseen päätökseen päätyneiden aloitteiden otsikoiden sanapilvi

Näyttää siis siltä, että erityisesti liikenne- ja viestintäministeriön hallinnonalaan kuuluvat tapaukset nauttivat suurta yksimielisyyttä.

Tämän aiheen parissa saisi varmasti hedelmällistä tutkimusta aikaiseksi. Vinkki innokkaalle väitöskirjan tekijälle, jolla on allekirjoittanutta enemmän aikaa.