Suomen tilastojärjestelmä ylsi ykkössijalle 186 valtiota kattaneessa vertailussa. Tilastokeskuksen pääjohtaja löytää kolme perustetta Suomen menestykselle Maailmanpankin arviossa.
Suomen datatalous lähdössä lentoon
Datamenestyjät-kilpailun voittaja on tämän vuoden osalta valittu. Osallistuneet työt olivat hyvin mielenkiintoisia ja antavat ehkä suuntaa sille, miten datan jalostus tulevaisuudessa kehittyy. Tekniikan kehittyessä datan tallennus, siirto ja käsittely ovat halventuneet, osin muuttuneet jopa ilmaisiksi.
Nykypäivän data scientistilla on käytössään sellaiset analyysivälineet ja laskentakapasiteetti, josta parikymmentä vuotta sitten saatettiin vain haaveilla. Koodaustaitoiselle on tarjolla netissä huippuluokan analyysikirjastoja ja -rajapintoja ilmaiseksi.
Se mikä ei ole halventunut, on datan keruu. Ehkä tulevaisuudessa esimerkiksi IoT-laitteiden avulla sekin helpottuu, mutta toistaiseksi etenkin suurten, tilastolliseen käsittelyyn ja koneoppimiseen soveltuvien datajoukkojen kerääminen on kallista, hidasta ja työlästä. Siihen on varaa lähinnä suurilla vakiintuneilla toimijoilla, kuten suuryrityksillä, valtioilla ja isoilla kunnilla. Datatalous ja datan päälle rakentuvat ekosysteemit tarvitsisivat kuitenkin raaka-ainetta.
Yrityksille niiden keräämä data on kilpailuetu, ja useimmat yritykset eivät mielellään jaa sitä, etenkään ilmaiseksi. Näin ollen julkishallinnolle on jäänyt rooli tarjota jauhettavaa datatalouden myllyihin. Tämä lähtökohta on EU:n avoin data -ajattelun ytimessä.
Eurooppalainen datatalous on paljolti vielä lähtökuopissa, mutta Suomessa alamme lähestyä kriittistä pistettä, jossa siitä tulee oikeasti merkittävää liiketoimintaa.
Mikä tekee menestyvän datapalvelun? Datamenestyjät -kilpailutöissä nousee esiin ainakin kaksi ominaisuutta: visualisointi ja oikeanlainen kysymyksen asettelu.
Visualisoinnin merkitystä suurten datamäärien havainnollistajana ei voi liikaa korostaa. Perinteisesti tilastotieteilijät ovat rakastaneet numeroita, mutta eivät juurikaan ole kiinnittäneet huomiota niistä viestimiseen. Muutama pakollinen pylväs- tai viivadiagrammi on saattanut numeroiden ohesta löytyä, mutta jo karttojen käyttö on ollut kovin harvinaista. Useimmat tiedot voidaan kuitenkin kytkeä johonkin paikkaan, ja jo niiden visualisointi kartalle lisäisi tiedon arvoa huomattavasti. Tämä näkyi useassa kilpailutyössäkin.
Samoin erilaisten suhdelukujen ja suuruusluokkien hahmottaminen numeroista on vaikeaa, mutta kuvista hyvin helppoa. Visualisointi tuottaa helpolla tavalla lisäarvoa datalle.
Vaativampi, mutta vielä tärkeämpi datapalvelun ominaisuus on, että se vastaa oikeisiin kysymyksiin. Palvelun tulee tarjota käyttäjälle relevanttia tietoa ja jotain mitä ei muuten saa. Mitä paremmin palvelu vastaa johonkin tosielämän tietotarpeeseen, sitä menestyneempi se todennäköisesti on.
Toisaalta palvelun tarjoajan tulee ymmärtää, mihin kysymyksiin käytettävissä olevasta datasta voi saada vastauksen. Avoimien rajapintojen kautta saatava data on yleensä kerätty alun perin johonkin ihan muuhun käyttötarkoitukseen, jolloin sen soveltuvuus ja siitä saatava informaatio toiseen käyttöön voi olla merkittävästikin rajoittunut. Modernit edistyneet välineet kyllä laskevat tuloksia ja visualisoivatkin ne hienosti, mutta tulos voi olla täysin hyödytöntä kohinaa tai jopa valeinformaatiota.
Tällaisen datalukutaidon merkitys on kasvanut koko ajan. Jos tarvittavaa oikeaa dataa ei ole saatavilla, puutteellisestakin tiedosta saatetaan etsiä vastauksia. Erityisesti modernit koneoppimisvälineet pystyvät löytämään hämmästyttäviä yhteyksiä asioiden välillä. On kuitenkin asiantuntijan tehtävä arvioida, onko sillä merkitystä. Korrelaatio ei merkitse kausaliteettia.
Kirjoittaja työskentelee Kehittäminen ja digitalisaatio -palvelualueen ylijohtajana Tilastokeskuksessa. Hän käsittelee blogisarjassaan datan olemusta ja merkitystä nyky-yhteiskunnassa.
Lue samasta aiheesta:
Eri maiden digitalouksia voidaan vertailla kokeellisten tilastojen pohjalta. Kuinka iso osuus digitaalisilla alustoilla, verkkokaupalla ja muilla digitaalisen talouden toimialoilla on koko kansantaloudessa?
Se, että työssä vaaditaan erilaisia taitoja ja että niitä on kehitettävä, ei ole uutisaihe. Iso uutinen ei ole myöskään ollut Euroopan osaamisen teemavuosi 2023. Tämä blogi toivottavasti viitoittaa kuitenkin osaamisen teemassa eteenpäin.
Tutkimus työelämän vaatimista taidoista kertoo eroista sukupuolten ja koulutusasteiden välillä. Digilaitteet hallitsevat kuitenkin jo useimpien työntekoa. Raskasta ruumiillista työtä tekee joka viides, sorminäppäryyttä edellyttävät joka kymmenennen työtehtävät.
Tietopohjaista päätöksentekoa tukeva Datahuone tuo uusia rekisteriaineistoja tutkimus- ja selvityskäyttöön. Pyrimme saamaan Datahuoneelle toimitettuja aineistoja laajempaan käyttöön kehittämällä uusia valmisaineistoja yhteistyössä tutkijoiden kanssa.
Suomen digitaalitalouden osuus arvonlisäyksestä on reilut seitsemän prosenttia. Suomessa on korostunut etenkin digitaalisten palveluiden tuotanto, kertovat ensimmäiset kattavat laskelmat digitaalisesta taloudestamme. Laskelmat ovat vielä luonteeltaan kokeellisia.
Kehittyneen tietotuotantomme avulla voidaan löytää ratkaisuja Suomen nykyisiin ja tuleviin haasteisiin. Tilastokeskuksen johto ehdottaa tulevan hallituksen ohjelmaan konkreettisia kirjauksia, joiden pohjalta päästäisiin nopeasti liikkeelle.
Tutkija- ja aineistopalvelun määrittäminen Tilastokeskuksen tehtäväksi on merkittävin lainsäädäntöön tehty muutos. Yhdessä rekisterinpitäjien ja tutkijayhteisön kanssa voimme luoda rekisteritutkimukselle kansainvälisesti ainutlaatuisen tutkimusinfrastruktuurin.