Ja sosiaalinen media on tiukasti kytköksissä toiseen aikamme ilmiöön: big dataan. Tuotamme ennen näkemättömän määrän dataa, jota meillä on myös viimein mahdollisuus massiivisissa määrin analysoida. Myös sosiaalisen median käyttäytymisemme tuottaa paljon tällaista hyödynnettävää dataa. Esimerkiksi vastikään uutisoitiin unettomuudesta kärsivien twiittaajien käyttäytymistä koskeva tutkimus.
Onneksi Twitterin louhintaa ei ole jätetty pelkästään ammattilaisten vastuulle vaan myös tällaiset harrastelijat pääsevät käsiksi Twitterin dataan ilmaiseksi avoimen rajapinnan kautta. Ja niin tein minäkin. Tarvitaan vain R:n kirjasto TwitteR sekä apps.twitter.com-osoitteessa rekisteröitävä "applikaatio". Tiettyjä rajoitteita tässä mekanismissa on, esimerkiksi haettavien twiittien määrä. Ja ainakin näin ensikokeilujen jälkeen vaikuttaa siltä, että twiittejä onnistuu hakemaan vain noin viikon ajalta. Siksi Twitterin louhinnassa on hyvä olla ajan hermolla uuden hashtagin syntyessä. Vaikka kuinka olisin halunnut louhia esimerkiksi #normitalkoot-hashtagia niin alle 20 twiitillä ei pitkälle pötki. Myöskään #kokoomusnuorista ei hirveästi materiaalia irronnut.
Aiheena ensimmäiselle Twitter-blogipostaukselleni valikoitui lopulta (lähinnä koska ei tullut muutakaan mieleen) #digihaaste-kampanja. Digihaaste on Valtiovarainministeriön järjestämä avoin kansalaisille suunnattu aloite, jolla haettiin ajatuksia digitalisaation hyödyntämisestä. Digitalisaatio on siis tämä trendisana, joka tarkoittaa käytännössä digiteknologian integrointia kaikkeen toimintaan. Se on myös yksi Sipilän hallituksen kärkihankkeista. Digi-jargonista jokainen voi lukea enemmän vaikka Mikael Jungnerin pamfletista. Nyt katsotaan, että ketkä ja miten aiheesta Twitterissä puhuvat. #digihaaste-hashtagilla sain käsiini 143 twiittiä, jotka toimivat aineistonani.
Katsotaan ensiksi edellisestä blogipostauksestani tuttua sanapilveä. Eli mitä sanoja digihaasteeseen liittyvät twiitit sisältävät. Tällä kertaa en tehnyt välimerkkien ja numeroiden poistamista kummempaa käsittelyä tekstiaineistolle eli yhtään sanaa ei ole mukavuussyistä poistettu.
(klikkaa taas isommaksi)
Mitään kovin syvällistä sanottavaa ei tästä sanapilvestä löydy. Luonnollisesti #digihaaste on isoin, koska se on sana jolla twiittejä haettiin. Myöskään trendisana #digitalisaation löytyminen ei yllätä. Aiheeseen täysin tutustumaton voi kuitenkin joitain viitteitä kontekstista löytää. Toimintaympäristö ja valtionhallinto kertovat perusidean, julkisen hallinnon digitalisoinnin. Digihaasteen osallistavasta luonteesta kertoo esityksiin, odottamiseen ja ehdotuksiin liittyvät sanat. Joitain ehdotusten aiheitakin löytyy: rakennuslupahakemukset ja kyberturva. Mielenkiintoisena detaljina on saamelaiset ja digisaame.En ala arvuuttelemaan, että mitä digitalisaation mahdollisuuksia saamelaisissa nähtiin.
Tekstien sisällön lisäksi on ihan mielekästä myös tarkastella vähän niiden kirjoittajia. Aineistossa selkeästi aktiivisimpana käyttäjätunnuksena esiintyy energiatutka, jolle kertyy 42 twiittiä 143 kokoisesta aineistosta. Energiatutkan jälkeen PauliinaMakela teki kuusi twiittiä ja LeenaViljo viisi. Joillakin on neljä, kolme tai kaksi twiittiä, mutta iso osa aineistosta koostuu vai yhden twiitin käyttäjätunnuksista. Keskustelu digihaasteesta on siis jakaantunut laajalle joukolle, josta löytyy vain yksi todellinen aktiivi.
Isommalla aineistolla twiittaajien suhteita olisi mielenkiintoista tarkastella lähemmin. Mutta harjoituksen vuoksi teen sen myös tällä. Alla olevassa kuvassa näkyy käyttäjien suhteet toisiin käyttäjiin siten, että vastaajan (=reply-toimintoa käyttäneen) twiitissä esiintyy #digihaaste. Nuoli osoittaa vastattavan suuntaan, esim. ParastaPalvelua vastasi SariSarkomaan twiittiin käyttäen #digihaaste-hashtagia.
Niin no, eihän tällaisesta pienestä aineistosta mitään mielenkiintoisia suhteita saa selville. Kopponen keskusteli vuorovaikutteisesti MillaVirenin ja TimoHonkon kanssa, Energiatutka vastasi twiitteihin siellä sun täällä joista vkarttun-käyttäjän kanssa oli vuoropuhelua. OKFFI onnistui vastaamaan omaan twiittiinsä.
Koska en voinut vastustaa kiusausta niin tarjoan lukijoille bonuksena: #kokoomusnuoret-hashtagia käyttävien twiittien sanapilvi (yhteensä 32 twiittiä):
Tukahduttava sääntelyhän se siellä kokoomusnuoria taas huolestuttaa eli stereotypiat toteutuvat jälleen. Sen lisäksi järjestön tuleva puheenjohtajavaali puhuttaa. Jos puheenjohtajuuden kriteerinä pidetään somepöhinää niin Daniel Sazonov voinee olla tyytyväinen twitter-preesensiinsä.
Ensi askeleet Twitter-louhinnan mielenkiintoiseen maailmaan on nyt otettu. Koska en ole trendien pinnalla ratsastava somenatiivi niin otan enemmän kuin mielelläni vastaan mielenkiintoisia hashtag- tai käyttäjätunnusehdotuksia jatkotarkasteluun. Ehkä tässä täytyy itsekin alkaa käyttämään Twitteriä enemmän ja seuraamaan siellä muitakin kuin Jari Porttilaa, aachihjk:ta ja FF2:sen Tapsaa. Twitter on kuitenkin hyvin mielenkiintoinen datan lähde, jota tulen jatkossakin varmasti hyödyntämään.
Olkoon tämä blogi minun kontribuutioni digihaasteeseen. Nykyisin kun data on lähes loputon resurssi on mielestäni liki rikollista olla käyttämättä sitä poliittisten päätösten pohjana ja alustuksena.
Ei kommentteja:
Lähetä kommentti