Tietopohjaista päätöksentekoa tukeva Datahuone tuo uusia rekisteriaineistoja tutkimus- ja selvityskäyttöön. Pyrimme saamaan Datahuoneelle toimitettuja aineistoja laajempaan käyttöön kehittämällä uusia valmisaineistoja yhteistyössä tutkijoiden kanssa.

Avoin data – harrastetoiminnasta julkiseksi palveluksi
Data on uusi öljy, sanotaan. Se ei tarkoita vain sitä, että data on arvokasta ja sen omistajuudesta taistellaan. Data on myös yhteiskunnan käyttövoima ja voitelija. Kaikki toiminta yhteiskunnassa kuluttaa ja tuottaa dataa, ja kaikenlaista toimintaa voidaan myös sujuvoittaa datan avulla.
Esimerkiksi verkkokauppaostoksessa käytetään kauppiaan tuoteluetteloa ja ostajan käyttäjäprofiilia sekä tuotetaan uutta ostotapahtumatietoa. Tilaamista voidaan sujuvoittaa vaikkapa tunnistamalla asiakkaan sijainti ja listaamalla lähellä olevat toimituspisteet. Logistiikkaakin optimoidaan datalla.
Dataan perustuvat toimintamallit ovat jo niin yleisiä, että yhteiskuntamme ei toimi enää ilman jatkuvia datavirtoja. Ja vauhti vain kiihtyy. Tiedolla johtamisen filosofia on sisäistetty niin yritysten kuin julkishallinnonkin johdossa. Päätöksentekijät kaipaavat yhä enemmän dataa, yhä useammista aihealueista ja yhä nopeammalla syklillä. Dataa tuottavat organisaatiot, kuten Tilastokeskus, ovat helisemässä uusien vaatimusten paineissa. Maailma vaatii polttoainetta, muuten pyörät pysähtyvät.
Kun aloittelin työuraani ohjelmistokehittäjänä 1980–90-lukujen vaihteessa, työtäni rajoitti käyttökelpoisen datan puute. Tein kartta- ja tilastografiikkasovelluksia, mutta oli erittäin vaikeaa löytää käyttökelpoista dataa edes testaustarkoituksiin. Kaikki tieto oli suljetuissa järjestelmissä, eksoottisissa tiedostomuodoissa. Jos jotain oli saatavilla, se oli hyvin kallista. Digitaalinen talous kehittyi kovin hitaasti.
Nykyisin tilanne on parempi. Lähes kaikki julkishallinnon organisaatiot julkaisevat avointa dataa sivuillaan. Kansainväliset organisaatiot, kuten OECD tai Maailmanpankki, tarjoavat paljon dataa. Myös useat kaupalliset toimijat, kuten pörssit, tuovat tapahtumadataa saataville API-rajapinnan kautta. Monelle yritykselle data on kuitenkin kriittinen kilpailutekijä, joten ne eivät edelleenkään ole halukkaita julkaisemaan dataansa muille.
Lisääntynyt datan määrä tuo uusia haasteita. Yksi merkittävä ongelma avoimesti saatavilla olevissa datoissa on niiden yhteensopivuus. Jokainen toimija julkaisee dataa omista lähtökohdistaan ja itselleen sopivilla käytännöillä. Näin ollen tietojoukkojen kattavuus, tietomallien yhteensopivuus sekä ajallinen tai aggregointitason yhteensopivuus voivat olla heikkoja.
Tiedostoformaattiongelmista on onneksi jo enimmäkseen päästy. Jonkinlaista kehikkoa tai kokonaisarkkitehtuuria kuitenkin kaivattaisiin, jotta dataa yhdistelevät palvelut voivat järkevästi toimia.
Datatalouden toimijoiden uskottavuus edellyttää myös datalähteiden julkistamista. Tarvitaan avoimesti tietoa siitä, mitä datajoukkoa käytetään, kuka datan on tuottanut, ja koska se on ladattu tai luettu rajapinnasta. Erityisen tärkeää tämä on siinä vaiheessa, kun aletaan yhdistelemään datoja eri tiedontuottajilta. Käytetyn tiedon laatu ja luotettavuus on kyettävä osoittamaan selkeästi ja siten, että kuka tahansa kuluttaja sen ymmärtää. Lopputulos voi olla vain niin hyvä kuin huonoin käytetty data.
Haasteista huolimatta avoimen datan palveluista on muotoutumassa vähitellen uutta digitaalista julkista infrastruktuuria valmiiden asiointi- ja tiedotuspalveluiden rinnalle. Mitä enemmän ja parempilaatuista dataa on saatavilla, sitä parempia palveluita niiden varaan voidaan rakentaa.
Olemme vasta kehityksen alkutaipaleella, mutta esimerkiksi Sovellukset - avoindata.fi sivusto tarjoaa jo esimerkkejä siitä, mikä on mahdollista. Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on kuitenkin vielä paljolti hyödyntämättä. Tulevaisuudessa datapalveluiden on oltava entistä ammattimaisempia, ja niiden tulee nousta virastojen ja laitosten muiden toimintojen rinnalle olennaiseksi osaksi toimintaa.
Kirjoittaja työskentelee Kehittäminen ja digitalisaatio -palvelualueen ylijohtajana Tilastokeskuksessa. Hän käsittelee blogisarjassaan datan olemusta ja merkitystä nyky-yhteiskunnassa.
Lue samasta aiheesta:
Suomen digitaalitalouden osuus arvonlisäyksestä on reilut seitsemän prosenttia. Suomessa on korostunut etenkin digitaalisten palveluiden tuotanto, kertovat ensimmäiset kattavat laskelmat digitaalisesta taloudestamme. Laskelmat ovat vielä luonteeltaan kokeellisia.
Kehittyneen tietotuotantomme avulla voidaan löytää ratkaisuja Suomen nykyisiin ja tuleviin haasteisiin. Tilastokeskuksen johto ehdottaa tulevan hallituksen ohjelmaan konkreettisia kirjauksia, joiden pohjalta päästäisiin nopeasti liikkeelle.
Tutkija- ja aineistopalvelun määrittäminen Tilastokeskuksen tehtäväksi on merkittävin lainsäädäntöön tehty muutos. Yhdessä rekisterinpitäjien ja tutkijayhteisön kanssa voimme luoda rekisteritutkimukselle kansainvälisesti ainutlaatuisen tutkimusinfrastruktuurin.
Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tietovarallisuus, joka on Suomen kilpailuetu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.
Elämme aikoja, jolloin totuutta on puolustettava näkyvästi. Vastuullamme on huolehtia demokratiaa palvelevan tilastotuotannon elinehdoista: luottamuksesta ja puolueettomuudesta.
YK:n uusi suositus kansantalouden tilinpitojärjestelmäksi valmistuu vuosikymmenen puolivälissä. Tavoitteena on kuvata paremmin yhteiskuntia muuttavia ilmiöitä kuten hyvinvointi ja kestävä kehitys, globalisaatio, digitalisaatio ja sen yhteydessä esimerkiksi krypto-varojen käsittely.
This year the fundamental principles of statistical work prepared by the United Nations Statistical Commission will be 30 years old. Over the years, their importance has grown in society. The fundamental principles provide a sound basis for the management and dissemination of information, especially in the public sector.