Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät
  • Tämä juttu on arkistoitua sisältöä, joka tarjotaan luettavaksi sellaisenaan. Tämän vuoksi siinä voi olla saavutettavuusongelmia.

Hype laantuu, iso data arkipäiväistyy

4.5.2015
Twitterissä: @mrsbruun ‏

Pahin hypetyspöly big datan, eli suomalaisittain ison datan, ympärillä on hiljalleen laskeutumassa ja tilalle on nousemassa tilastoinninkin kannalta mahdollisuuksia. Iso data tarjoaa vakavasti otettavan lisän tilastotuotannon modernisoimiseksi.

Marjo Bruun, Tilastokeskuksen pääjohtaja

Pahin hypetyspöly big datan, eli suomalaisittain ison datan, ympärillä on hiljalleen laskeutumassa ja tilalle on nousemassa tilastoinninkin kannalta mahdollisuuksia. Iso data tarjoaa vakavasti otettavan lisän tilastotuotannon modernisoimiseksi.

Räjähdysmäisesti kasvava tiedon määrä sähköisissä järjestelmissä on jo vuosia ruokkinut visioita datavallankumouksesta, joka johdattaa yhteiskunnan uudelle tekniselle ja tiedolliselle tasolle. Reaaliaikaisesti tarjolla oleva lähes rajaton tietomäärä mahdollistaa edullisen perustan uusien palveluiden tuottamiseksi ja vanhojen uudistamiseksi.

Uskoa vahvistavat konkreettiset esimerkit uudesta tulevaisuudesta ovat toistaiseksi olleet vähissä. Ponnistelut alkavat kuitenkin viimein tuottaa hedelmää. EU-maiden tilastovirastot ovat yhteisessä strategiassaan sitoutuneet ison datan hyödyntämiseen tilastokäytössä (ns. Scheveningen Memorandum), ja uusien ideoiden testauksesta ollaan siirtymässä tuotannollisiin ratkaisuihin.

Pisimmällä ollaan varmaankin Hollannissa. Maanteiden massiivisen sensoriverkoston raakadataa on analysoitu nykyaikaisin menetelmin, jotta tieliikennetilastoja voitaisiin rikastaa. Hollannissa on myös tuloksellisesti testattu väestön taloudellisia odotuksia kuvaavien tilastojen täydentämistä Twitterin ja Facebookin tarjoamalla datalla. Sosiaalisen median mahdollinen käyttö tilastotoimessa on kaikkiaan kansainvälisen tilastoyhteisön mielenkiinnon kohteena.

Myös muualla on edistytty ison datan hyödyntämisessä. Italiassa kuluttajahintaindeksin lentomatkatietoja ja kodinelektroniikkatietoja täydennetään internetistä kerättävillä tiedoilla. Myös Tilastokeskuksessa on meneillään kehittämishanke, jolla pyritään selvittämään kahden uuden datalähteen eli verkkokauppojen ja kassapääteaineistojen hintatietojen hyödyntämistä.

Useat maat ovat jo testanneet kännyköiden käytöstä kertyvää dataa matkailu-, työssäkäynti- ja muuttoliiketilastojen tekemisessä. Suuria toiveita asetetaan satelliittikuvauksen hyödyntämiseen maataloustilastoissa.

Tyypillisimmät datalähteet tilastojen täydentämiseksi ovat ainakin toistaiseksi olleet sosiaalinen media, mobiililaitteista kertyvä data ja internetin tietojen hyödyntäminen. Lyhytkin kokemus on osoittanut niiden tarjoavan usein nykyistä nopeamman ja edullisemman tavan tuottaa tietoa. Samanaikaisesti EU:n tietosuojadirektiiviä ollaan uudistamassa. Sen vaikutus esimerkiksi mobiilidatan käyttöön on vielä epäselvää.

Ison datan hyödyntämistä on tilastovirastoissa arvioitu myös menetelmällisistä lähtökohdista. Uusi ja vanha tuotantomalli eivät sulje toisiaan pois, vaan niiden välillä on myös yhtäläisyyksiä. Jo nyt kansantalouden tilinpito käyttää erilaisia lähteitä, joiden luotettavuutta arvioidaan kokonaistaloudellisessa kehikossa. Hallinnollisten aineistojen tiedot koostetaan tilastovirastojen välittömän ohjauksen ulkopuolella, mutta aineistojen laatua pystytään silti arvioimaan riittävän luotettavasti.

Edistysaskeleista huolimatta haasteita toki riittää. Hallinnollisista aineistoista poiketen suurin osa isosta datasta on yritysten hallussa. Datan käyttö tilastojen pohjana edellyttää uusien, molempia osapuolia hyödyttävien kumppanuuksien luomista. Monissa tapauksissa myös kansallista lainsäädäntöä tulisi kehittää yhteiskunnan muuttuvien tarpeiden myötä. Samalla on huolehdittava siitä, että tilastotuotannon kulmakivi, yksilön tietosuoja, on varmistettu asianmukaisella tavalla.

Tehokkaasti organisoitu tilastotoimi edellyttää uusien tietovarantojen innovatiivista hyödyntämistä. Tarve korostuu tiukassa taloudellisessa tilanteessa. On selvää, ettei myöskään Tilastokeskus voi jättää huomioimatta uusien tietolähteiden tuomia mahdollisuuksia.

Marjo Bruun on Tilastokeskuksen pääjohtaja.

 

Lue samasta aiheesta:

tk-icons