Reilun vuoden toiminut nopeaa analyysia tuottava yksikkö haastaa Tilastokeskusta hyvällä tavalla.

Suuret tietovarannot, suuret odotukset
Suomessa on poikkeuksellisen laadukkaat rekisterit kansalaisista, yrityksistä ja yhteisöistä. Rekisterit kertovat faktoja siitä, mitä me teemme ja miten meillä menee. Rekisterinpitäjiä on useita, ja kullakin on oma näkymänsä yhteiskuntaan.
Tilastokeskus on poikkeuksellinen tiedon solmukohta, koska sen haltuun on omien aineistojen lisäksi suotu Suomen tärkeimmät tietovarannot myös muilta rekisterinpitäjiltä. Tällaista tiedon keskittymää ei ole muualla.
Tiedon keskittäminen mahdollistaa tietojen yhdistämisen. Esimerkiksi tulorekisteriaineiston ja sähkömarkkinadatan yhdistämällä voimme vastata kysymykseen: kuinka paljon Suomessa on pienituloisia sähkölämmitteisessä talossa asuvia kotitalouksia, joilla ei ole kiinteähintaista sähkösopimusta. Toisistaan irrallaan näillä rekisteritiedoilla voitaisiin tarkastella vain tulotasoa tai energiankulutusta erikseen, ei näiden kahden yhteisvaikutusta.
Rekisterien pohjalta syntyvä tietovarallisuus on Suomen kilpailuetu. Jos hyödynnämme sitä, pystymme tekemään parempia päätöksiä niin kansalaisten arjessa, yrityksissä kuin ylimmän valtiojohdonkin tasolla.
Tietoon pohjautuvan päätöksenteon merkitys on tiedostettu. Siitä on raportteja ja selontekoja runsaasti, esimerkiksi Sipilän hallituksen aikainen tietopoliittinen selonteko ja Marinin hallituksen aikainen Valtioneuvoston periaatepäätös tiedon hyödyntämiseksi ja avaamiseksi. Teemaa käsitellään myös Julkisen hallinnon strategiassa, Suomen digitaalisessa kompassissa ja Euroopan datastrategiassa. Näissä kaikissa alleviivataan tiedon hyödyntämisen merkitystä.
Koska Tilastokeskus on ainutlaatuinen tiedon solmukohta, kohdistuu tietovarantojemme hyödyntämiseen tietenkin suuret odotukset. Niin sisältä kuin ulkoakin.
Haasteen muodostaa suurten odotusten ja supistuvien resurssien yhteensovittaminen. Tilastokeskukselle valtion budjetissa kohdennetut toimintamenot ovat reaalisesti supistuneet, ja on varauduttava siihen että supistuvat jatkossakin. Tilastokeskuksen budjetissa kilpailevat keskenään tilastotuotannon velvoitteiden täyttäminen, järjestelmien uudistamistarpeet, henkilöstön jaksaminen ja odotukset tietovarallisuuden hyödyntämisestä. Kaikkien osa-alueiden priorisoiminen yhtä aikaa on vaikeaa.
Olemme ottaneet viime vuosina tiedon hyödyntämisessä harppauksia eteenpäin. Ei ehkä yhtä suuria kuin tiedon käsittelyn teknologian kehittyminen olisi mahdollistanut, mutta merkittäviä kuitenkin. Pelkästään Tilastokeskuksen avoimessa StatFin-tietokannassa on julkaistu lähes kahdeksan miljardia havaintoa laadukasta tilastotietoa yli 5 000 tietokantakuutiossa, ja niiden määrä on kasvanut vuosittain noin 15 prosentin vauhtia.
Korona-aikainen tilannehuone raotti näkymää sille, mitä kaikkea Tilastokeskuksen käsittelemien ja yhdistelemien tietoaineistojen avulla on mahdollista tehdä. Nyt ministeriöiden datahuone jatkaa tuota työtä ministeriöiden päätöksenteon tukena. Konseptin muotouduttua olisi luonnollista rakentaa vastaavia reaaliaikaisen data-analyysin mahdollistavia datahuoneita muillekin toimijoille. Datahuone on kuitenkin vain yksi tiedon hyödyntämisen kanava.
Kansallisen tietovarallisuuden potentiaalin hyödyntämisessä on valtavasti mahdollisuuksia. Maksullista dataa voitaisiin avata yhä enemmän. Etenkin avoimen aluedatan palvelulle olisi suurta kysyntää. Keväällä (toistaiseksi) lakkautettua Findikaattori-palvelua jäivät kaipaamaan sadat tuhannet käyttäjät, ja se ansaitsisi modernisoidun seuraajan. Esimerkkiä voi hakea Virosta, mutta riman voisi nostaa korkeammallekin.
Ministeriöiden datahuoneen ohella kansalaisyhteiskunnalle olisi mahdollista rakentaa oma tilannekuvapalvelu, joka sisältäisi Tilastokeskuksen asiantuntevien data-analyytikoiden kuratoimia reaaliaikaisia ja interaktiivisia indikaattoreita ajankohtaisista aiheista. Norjan Microdata.no-tyyppisellä ”tilastokoneella” käyttäjien olisi mahdollista koostaa Tilastokeskuksen tarkoista tietoaineistoista itse haluamiaan tilastoja, kuitenkaan tinkimättä tietoturvallisuudesta.
Eri julkisen sektorin toimijoilla on paljon muitakin mittaristotarpeita eli tarve visualisoida tilannekuvaa, tavoitteita ja kehitystä kuvaavia indikaattoreita. Sen sijaan, että teemme mittaristoja kukin tahoillamme, olisi järkevää keskittää voimavaroja kansallisen indikaattorialustan rakentamiseen. Tätä ja monia muita tavoitteita tukisi kansallisen tilastotietokannan rakentaminen, jolloin eri tiedontuottajien tuottama tieto olisi saatavilla yhdestä lähteestä, yhtenäisillä metatiedoilla ja rajapinnoilla.
Tässä on mainittu muutamia, muttei tietenkään kaikkia käyttäjätarpeista kumpuavia ratkaisuja, joilla Tilastokeskuksen olisi mahdollista edistää tiedon hyödyntämistä ja saavutettavuutta Suomessa. Näin saisimme Tilastokeskukseen kootun kansallisen tietovarallisuuden paremmin käyttöön.
Viime aikojen kriisit ovat osoittaneet suomalaisen varautumistyön arvon ja huoltovarmuuden merkityksen. Tilastokeskus ylläpitää monia yhteiskunnan tietoinfrastruktuurin kannalta kriittisiä järjestelmiä. Ilman kansantalouden tilinpidon lukuja ei ole luottoluokitusta, eikä ilman luottoluokitusta ole valtionlainoja. Ilman hintaindeksien päivityksiä ei ole indeksikorotuksia. Nämä ja monet muut yhteiskunnan toiminnan kannalta tärkeät tiedot tuotetaan järjestelmillä, jotka vaativat ylläpitoa ja uudistamista.
Kansallisen tietovarallisuuden hyödyntäminen rakennetaan Tilastokeskuksen tietovarantoinfran päälle, ja infra muodostaa kivijalan, jonka kehittäminen on tiedon hyödyntämisen kannalta äärimmäisen tärkeää. Ilman tietovarantojen kehitystyötä jäävät askeleet Tilastokeskuksen modernisoinnissa ja uusissa tiedon hyödyntämisen tavoissa puolitiehen. Ennen kaikkea on varmistettava, että käytämme uusinta teknologiaa niin, että saamme hyödynnettyä tietovarallisuutemme potentiaalin tietoturvallisesti.
Meillä on Suomessa poikkeuksellinen tietovarallisuus, jonka potentiaalin lunastamisessa otamme koko ajan askeleita oikeaan suuntaan. Etenkin epävarmuuden vallitessa ja yhteiskunnan kriisinkestävyyden merkityksen noustessa, meidän on huolehdittava myös tietoinfran huoltovarmuudesta ja katsottava myös tulevaan.
Nykyteknologialla meidän on mahdollista tuottaa tietoa, jollaista ei ole ikinä ennen pystytty tuottamaan. Tilastokeskus pyrkii kaikin keinoin mahdollistamaan uusia tapoja hyödyntää tietoa kaikilla yhteiskunnan tasoilla. Uskomme, että parempi tieto tuotetaan kaikkien yhteiskunnan tiedontuottajien yhteistyönä.
Kirjoittaja on Tilastokeskuksen pääjohtaja.
Lue samasta aiheesta:
Kesälomani lopulla seurasin sivusilmällä lukiolaisnuoren pakkausruljanssia. Edessä oli vaihto-oppilasvuosi ja lähtöön muutama päivä. Mahtuisiko matkaan myös taskullinen tietoa Suomesta?
Talouden keskeiset mittarit näyttävät isoja ja ristiriitaisiltakin vaikuttavia muutoksia. Tilastojen päälinja lienee oikea, mutta lukuihin voi laskennan tarkentuessa tulla revisioitakin, kun talouden rakenteessa on tapahtunut muutoksia. Tarkentumisten suuntaa ei pysty ennakoimaan, se vaihtelee eri vuosien välillä.
Kehittyneen tietotuotantomme avulla voidaan löytää ratkaisuja Suomen nykyisiin ja tuleviin haasteisiin. Tilastokeskuksen johto ehdottaa tulevan hallituksen ohjelmaan konkreettisia kirjauksia, joiden pohjalta päästäisiin nopeasti liikkeelle.
Tutkija- ja aineistopalvelun määrittäminen Tilastokeskuksen tehtäväksi on merkittävin lainsäädäntöön tehty muutos. Yhdessä rekisterinpitäjien ja tutkijayhteisön kanssa voimme luoda rekisteritutkimukselle kansainvälisesti ainutlaatuisen tutkimusinfrastruktuurin.
Tilastokeskus ottaa tänään käyttöön uuden visuaaliseen ilmeen. Uudella ilmeellä haluamme paitsi puolustaa luotettavaa tietoa myös innostaa ihmisiä tilastojen inspiroivaan maailmaan.
Uudessa saamelaiskäräjälakiesityksessa kielikriteeri laajenisi kolmannesta sukupolvesta neljänteen polveen. Kieli kuvaa yhteisöön kuulumista ja yhteyttä elävään saamelaiseen kulttuuriin, kirjoittaa Juho Keva saamelaisten kansallispäivän blogissaan.
Demokratioissa tilastot ovat osa yhteiskunnallista keskustelua, päätöksentekoa sekä seurausten arviointia – ja puolueettomina ne luovat edellytyksiä kompromisseille. Tietoon perustuva päätöksenteko edellyttää hidasta, harkitsevaa ja kyseenalaistavaa ajattelua. Jotta demokratia säilyisi informaatioyhteiskunnan perustana, tulisi tilastojen luku- ja käyttötaidosta tehdä yleinen kansalaistaito.