Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tietovarallisuus, joka on Suomen kilpailuetu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.

Laadukkaat perustietovarannot ovat edellytys datatalouden etenemiselle
Suomi on perinteisesti nähty perustietovarantojensa osalta maailman huippumaana – rekisterit ovat ajan tasalla ja laadukkaita. Silti Suomi sijoittui sijalle 28 eli neljän viimeisen joukkoon OECD:n tekemässä Euroopan hallintojen digitalisaatiovertailussa 2019. Sijoitus nostatti kohua, vaikka pienenä lohdutuksena olikin Ruotsin jääminen viimeiseksi.
En tässä lähde arvioimaan tuon selvityksen lukuja, mutta tuore selvitys perustietovarantojen laadun nykytilasta nostaa esiin samoja asioita.
Valtiovarainministeriö on käynnistänyt Laatukehikko-hankeen julkisten tietovarantojen käytettävyyden parantamiseksi ja tietoaineistojen yhteiskäytön helpottamiseksi. Sen tuloksena on määrä syntyä tietoaineistojen laatukriteerit, jotka tähtäävät paremman laadun tuottamiseen.
Laatua voidaan lisätä yksinkertaisin keinoin
Hankkeen ensimmäinen etappi oli tuo alussa mainittu nykytilaselvitys. Siinä nousi esiin joukko parhaita käytäntöjä ja edellytyksiä laadun tekemiselle. Huomioitavia asioita ovat muun muassa tietoaineiston selkeä omistajuus, tiedon tuottajan eli operatiivisen järjestelmän merkitys sekä master datan käytön lisääminen.
Esimerkkejä parhaista käytännöistä ovat tikettijärjestelmän hyödyntäminen palautteen hallinnassa (Kuntatalouden tietopalvelu), automatisoidut tarkastukset tiedon vastaanotossa (Tulli, Tilastokeskus, Vero) ja niiden muuttaminen esitettävään muotoon (Maanmittauslaitos).
Master datan käyttö on parantanut esimerkiksi Kaupparekisterin laatua, kun ajoneuvorekisteri ryhtyi hakemaan sieltä yritysten osoitetietoja. Selvityksessä kävi myös ilmi, että laatu paranee, jos rekisterin pitäjä tiedon kokoamisen lisäksi itsekin käyttää tietoa.
Nämä ovat yksinkertaisia, mutta välttämättömiä asioita, joita ei vielä hyödynnetä kaikissa perustietovarannoissa. Sekä tiedon käyttö että sen avoimuus ovat omiaan lisäämään laatua. Perustietovaranto ei ole perustietovaranto ilman laajaa käyttöä!
Hankkeen myötä onkin tullut ilmi jonkinlaisen laatutestin tarpeellisuus. Sen avulla voisi tunnistaa parhaita käytäntöjä ja edesauttaa niiden leviämistä eri organisaatioissa.
Kohti kokonaisvaltaista kehittämistä
Selvityksessä nousi esiin myös parannuskohteita. Tiedon laatua kehitettäessä on huomioitava koko tiedonkäytön ekosysteemi – tiedon tuottaja, rekisterinpitäjä ja käyttäjä. Esimerkiksi monessa perustietovarannossa kunta on keskeinen tiedontuottaja, ja rekisterinpitäjällä itsellään ei ole suoraan mahdollisuutta vaikuttaa kerättyjen tietojen laatuun.
Keskeinen haaste on myös se, jos kehittämisestä aiheutuva hyöty ei konkretisoidu perustietovarannon ylläpitäjälle itselleen. Silloin on vaikea perustella resursseja tietovarannon sisällön tai laadun kehittämiseen.
Tiedon käyttäminen parantaa sen laatua. Niinpä mietintään pitäisikin ottaa tiedon käyttövelvoite, joka lisäisi perustietovarantojen käyttöä ja samalla parantaisi niiden laatua. My Data -periaatteen tuominen julkisiin tietovarantoihin voisi myös lisätä luottamusta viranomaisten toimintaan, parantaa mahdollisuuksia kerätä tarpeellisia tietoja ja lisätä niiden hyödynnettävyyttä.
Nykytilaselvitys ei vastaa kysymykseen, ovatko Suomen perustietovarannot laadukkaita ja ajantasaisia. Sen sijaan hyvin toteutettuina laatukriteerit voivat kertoa perustietovarantojen laadusta. Jos niille asetetaan myös tavoitteet, niillä voidaan saavuttaa tarvittava ohjaava vaikutus laadun parantamiseksi.
Mielestäni laatukriteereiden lisäksi tarvitaan edellä esitetty laatutesti, joka auttaa sparraamaan organisaatioita hyödyntämään tietoa ja kehittämään laatua.
Datatalous vaatii laadukkaita ja yhteen toimivia perustietovarantoja. Nyt tehty nykytilaselvitys osoitti, että kokonaiskuva ei ole täysin hallinnassa ja parhaat käytännöt voivat jäädä hyödyntämättä. Hanke on hyvä alku, mutta jatkossa kaikkien tietoekosysteemissä toimivien välille tarvitaan pitkäaikaista yhteistyötä ja koordinointia.
Lue lisää tiedon laatukehikko -hankkeesta.
Kirjoittaja toimii yli-insinöörinä Maanmittauslaitoksessa ja hänellä on pitkä kokemus paikkatietojen laadun kehittämisestä ja sen standardoimisesta.
Lue samasta aiheesta:
Elämme aikoja, jolloin totuutta on puolustettava näkyvästi. Vastuullamme on huolehtia demokratiaa palvelevan tilastotuotannon elinehdoista: luottamuksesta ja puolueettomuudesta.
Alamme Suomessa lähestyä kriittistä pistettä, jossa datataloudesta tulee oikeasti merkittävää liiketoimintaa. Mikä sitten tekee menestyvän datapalvelun? Datamenestyjät -kilpailutöissä nousee esiin ainakin kaksi ominaisuutta: visualisointi ja oikeanlainen kysymyksen asettelu.
Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on vielä paljolti hyödyntämättä. Myös julkisten virastojen ja laitosten datapalveluiden on tulevaisuudessa oltava entistä ammattimaisempia.
Lapsia koskevaa tietoa on paljon, mutta usein koetaan, että se on sirpaleista ja hajallaan. Tätä puutetta Tilastokeskus paikkaa tuottamalla laajan Tieto&trendit -artikkelisarjan lasten maailmaa avaavista tilastotiedoista. Lapset Suomessa -artikkelisarja nostaa esille yhteiskunnallisesti merkittävän aiheen tuottamalla vuoden ajan analyysia lasten elinoloista noin 30 artikkelin välityksellä.
Laadukas tieto on kuin design-tuote: se on kestävää, monikäyttöistä ja ajassa merkityksensä säilyttävää.
Tietoaineistojen laatu heijastuu tiedon pohjalta muodostuvaan ymmärrykseen yhteiskuntamme tilasta. Laatua koskevien arviointien ja kuvausten yhtenäistäminen vaikuttaakin ratkaisevasti myös yhteiskunnallisiin päätöksiin.
Yhteistyöllä luomme tulevaisuuden datataloudelle ja yhteiskunnalle vankan perustan, jonka ansiosta arvokkaat tietoaineistomme voivat palvella parhaalla mahdollisella tavalla Suomea tulevaisuudessa.