Tämä sivu on arkistoitu.

5.4.2022 jälkeen julkaistut tiedot löydät uudistetulta sivustolta.

Siirry uudelle tilastosivulle

Työssäkäyntitilaston laatuseloste

1. Tilastotietojen relevanssi

Työssäkäyntitilastossa tuotetaan keskeiset työssäkäyntiä koskevat tiedot vuosittain. Ennen vastaavia tietoja voitiin tuottaa ainoastaan väestölaskentavuosina. Työssäkäyntitilaston perusjoukko ja määrittelyt ovat pysyneet suunnilleen samana vuodesta 1987 lähtien. Vuodesta 1993 lähtien on tuotettu myös ennakkotietoja työssäkäynnistä.

Tuotettavia tietoja ovat muun muassa väestön pääasiallinen toiminta, elinkeinojakauma, ammattiasema, työpaikkojen lukumäärä, työpaikan sijainti, väestön ja työvoiman koulutus- ja tulotiedot. Tietoja voidaan tuottaa kaikilla hallinnollisilla aluejaoilla ja koordinaattipohjaisilla aluejaoilla (esim. postinumeroalueet, karttaruudut, kuntien osa-alueet).

Tilaston viiteajankohta on vuoden viimeinen viikko, mutta tilasto sisältää myös kertymätietoja tilastovuoden ajalta (esim. tulotiedot, työ- ja työttömyyskuukaudet). Vuosilta 1990, 1993, 1995 ja 2000 on saatavissa tietoja ammatista ja sosioekonomisesta asemasta.

Vuodesta 1993 lähtien työssäkäynnistä on tuotettu myös ennakkotietoja. Ennakkotietoja käytettäessä on kuitenkin otettava huomioon, että aineistojen keskeneräisyydestä johtuen ennakkotietojen mukaiset työllisten määrät poikkeavat lopullisista luvuista ±1 prosenttia koko maan tasolla. Kunnittain vaihtelu voi olla suurempaakin.

2. Tilastotutkimuksen menetelmäkuvaus

Työssäkäyntitilasto on kokonaisaineisto. Kunkin vuoden tilasto kattaa kaikki kyseisen vuoden viimeisenä päivänä Suomessa vakinaisesti asuvat henkilöt. Tilaston lähdeaineistoina käytetään lähinnä hallinnollisia rekistereitä ja muita rekisteripohjaisia tietoaineistoja. Tilaston laatu onkin siten suoraan riippuvainen lähdeaineistojen laadusta. Suoraa tiedonkeruuta tapahtuu vain toimipaikkatietojen määrittämisessä monitoimipaikkaisten yritysten ja kuntien toimintayksiköiden palveluksessa oleville.

Yhteensä lopullisen työssäkäyntitilaston tilastotiedoston valmistumisessa käytetään noin 40 eri rekisterin tai tietoaineiston tietoja. Keskeisimpiä näistä ovat:

  • väestötietojärjestelmä (Väestörekisterikeskus)
  • verotuksen eri aineistot
  • yksityisen sektorin erilaiset työ- ja palvelussuhderekisterit
  • valtion- ja kuntien palvelussuhderekisterit
  • työministeriön työnhakijarekisteri
  • Kansaneläkelaitoksen ja Eläketurvakeskuksen eläkerekisterit
  • eri opiskelijarekisterit
  • pääesikunnan varusmiesrekisteri
  • Tilastokeskuksen yritys- ja toimipaikkarekisteri ja julkisyhteisöjen rekisteri
  • Tilastokeskuksen tutkintorekisteri.

Rekistereiden lisäksi tehdään joitakin lomakekyselyitä:

  • tiedustelu monitoimipaikkaisissa yrityksissä työskentelevien toimipaikoista
  • kuntien toimintayksiköiden ja niiden monitoimipaikkaisuuden tiedustelu
  • tiedustelu kunnan monitoimipaikkaisissa toimintayksiköissä työskentelevien toimipaikoista.

Keskeistä järjestelmässä on se, että rekistereiden tunnusjärjestelmät ovat niin hyvät, että eri tietojen yhdisteleminen on mahdollista. Rekisterit voivat sisältää päällekkäistä tietoa, osin myös ristiriitaista tietoa. Olennaista on, että rekisterit täydentävät toisiaan ja päällekkäisyys toisaalta varmistaa sen, että järjestelmä ei ole niin haavoittuva; jos esim. työeläkejärjestelmästä ei saada tietoa työsuhteesta, voidaan tieto henkilön työllisyydestä päätellä verotuksen tietojen kautta.

Useat tiedot työssäkäyntitilastoon voidaan saada suoraan jostakin rekisteristä niitä juurikaan muuttamatta tai muokkaamatta. Tällaisia tietoja ovat esim. henkilön demografiset tiedot tai tulo- ja varallisuustiedot. Monia tietoja tuotetaan myös ns. rekisteriestimointimenetelmällä, jossa käyttämällä hyväksi samanaikaisesti useita rekisteriaineistoja määritellään jokaiselle henkilölle kunkin muuttujan arvo. Esimerkkinä tällaisesta muuttujasta on henkilön pääasiallinen toiminta. Sen päättelyssä tarvitaan tieoja henkilön iästä, työsuhteista, työttömyydestä, opiskelusta, eläkkeen saamisesta jne. Päättelysäännöt on muodostettu siten, että ne tuottavat mahdollisimman lähelle lomakepohjaisesti kerättyjen tietojen mukaisia tietoja. Päättelysääntöjen muodostamisessa on apuna käytetty aikaisempien väestölaskentojen tietoja ja rekisteritietoja samalta ajankohdalta. Päättelysääntöihin sisältyy myös eri aineistojen priorisointi niissä tapauksissa, kun tiedot ovat ristiriitaisia.

3. Tietojen oikeellisuus ja tarkkuus

Suomessa rekisteripohjaisten tietojen luotettavuutta tutkittiin jo ennen päätöksentekoa rekisteripohjaiseen väestölaskentajärjestelmään siirtymisestä. Vuosien 1980 ja 1985 laskennoissa väestön taloudellista toimintaa ja työssäkäyntiä kuvaavat tiedot kerättiin vielä lomakkeilla, mutta samanaikaisesti oli saatavilla myös rekisteripohjaisia tietoja. Vuoden 1980 väestölaskennassa tehtiin vertailututkimus 20 kunnan osalta ja vuoden 1985 väestölaskennan yhteydessä kaikkien kuntien osalta. Tutkimuksessa verrattiin rekisteripohjaisesti määriteltyä tietoa väestön pääasiallisesta toiminnasta ja ammattiasemasta lomakkeella kerättyyn tietoon. Erot rekisteripohjaisesti ja lomakepohjaisesti tuotettujen tietojen osalta todettiin niin pieniksi, että päätös rekisteripohjaiseen tilastotuotantoon siirtymisestä voitiin tehdä.

Ensimmäisen kokonaan rekisteripohjaisen väestölaskennan yhteydessä vuonna 1990 tehtiin laaja luotettavuustutkimus. Näitä rekisteritilastoja verrattiin otospohjaisen lomaketiedustelun antamiin tietoihin. Otos käsitti noin 2 % rakennuksista, asunnoista ja henkilöistä. Luotattavuustutkimus osoitti, kuinka suurella osalla lomaketieto ja rekisteritieto poikkesivat toisistaan, mutta ei lopulta sitä kumpi tieto on oikea. Esim. usean työn tekijä ilmoittaa lomaketiedustelussa pääasialliseksi työkseen eri toimen kuin mihin rekisteripäättelyssä päädytään. Työssäkäyvä opiskelija tulee määritellyksi rekisteritiedoilla väistämättä työlliseksi, vaikka hän itse jättäisi työnsä kertomatta. Tutkimukset ovat osoittaneet, ettei rekisteripohjaisten ja lomakepohjaisten tietojen ero ole suurempi kuin kahden lomakepohjaisen tiedon välinen ero. Vertailututkimuksia on julkaistu Tilastokeskuksen sarjoissa.

Tärkeimmäksi vuosittaisen rekisteripohjaisen työssäkäyntitilaston laadunvalvontamenetelmäksi on kehittynyt vuosittainen laadunvalvonta, joka perustuu työvoimatutkimuksen käyttöön vertailuaineistona. Myös vuoden 1995 ja 2000 väestölaskennan luotettavuustutkimus perustui työvoimatutkimuksen käyttöön vertailutietona.

Työvoimatutkimuksen käyttö vertailuaineistona toimii kahdella tasolla. Toisaalta seurataan näiden kahden menetelmän tuottamien tulosten tasoa ja toisaalta seurataan, miten hyvin yksikkötasolla menetelmät tuottavat samalla tavoin luokiteltua tietoa. Yksikkötason vertailu tehdään ristiintaulukoimalla työvoimatutkimuksen otosaineiston henkilöiden saman ajankohdan rekisteripohjaiset ja haastatteluun perustuvat tiedot pääasiallisesta toiminnasta ja toimialasta keskenään. Vertailuja on tehty vuodesta 1987 lähtien, jolloin poikkeamat analysoitiin varsin tarkkaan.

Usein poikkeamat ovat selitettävissä rekisterijärjestelmän ja haastattelumenetelmän eroilla eikä aina voida yksikäsitteisesti sanoa, kumpi menetelmä tuottaa oikean tuloksen eli välttämättä haastattelemallakaan saatu tieto ei ole absoluuttisen oikea. Usein todellisuudessa on niin, että henkilö itse tai haastattelija joutuu tekemään saman päätöksen ristiriitaisen informaation tilanteessa, johon rekisterimenetelmässä on laadittu yksikäsitteinen sääntö. Rekisterimenetelmän etuna on tällöin sen loogisuus, kone tekee ratkaisun aina samalla tavalla, kun taas saman informaation omaavat kaksi henkilöä voivat päätyä eri lopputulokseen.

4. Julkaistujen tietojen ajantasaisuus ja oikea-aikaisuus

Työssäkäyntitilasto tehdään vuosittain. Työssäkäyntitilaston henkilöperusjoukko kuvaa vuoden viimeisen päivän tilannetta. Tiedot henkilön toiminnasta ja työpaikasta ovat vuoden viimeiseltä viikolta. Tilastossa on myös kertymätietoja koko vuodelta (esim. tulotiedot, työssäolo- ja työttömyyskuukaudet) . Ennakkotiedot valmistuvat noin 12 kuukautta viiteajankohdan jälkeen. Lopullisista tiedoista pääasiallinen toiminta ja ammattiasema valmistuvat noin 18 kuukautta ja loput tiedot noin 22 kuukautta viiteajankohdasta.

5. Tietojen saatavuus ja läpinäkyvyys/selkeys

Työssäkäyntitilaston kunnittaiset tiedot työllisistä, työpaikoista ja pääasiallisesta toiminnasta ovat saatavilla Tilastokeskuksen internet-sivuilta, maksuttomasta StatFin-tilastopalvelusta. Maksullisessa Väestötilastopalvelussa on eritellympää tietoa, myös kuntien osa-alueittain. Aineistoista tehdään myös eritysselvityksiä asiakkaan pyynnöstä.

Vuosina 1987-2001 työssäkäyntitilaston tietoja on julkaistu erillisissä työssäkäyntitilaston julkaisuissa. Viimeinen paperimuotoinen julkaisu, Työssäkäyntitilasto 2000-2001, sisältää työssäkäyntitilaston vuoden 2000 lopullisia ja vuoden 2001 ennakkotietoja.

6. Tilastojen vertailukelpoisuus

Työssäkäyntitilaston laatiminen on aloitettu vuodesta 1987. Työssäkäyntitilaston perusjoukko ja määrittelyt ovat pysyneet suunnilleen samana vuodesta 1987 lähtien. Tilastossa käytetyt luokitukset ovat muuttuneet vuosien mittaan. Mm. toimialaluokitus on muuttunut vuonna 1993 ja 2001 ja ammattiluokitus vuonna 1995. Luokitusmuutokset vaikuttavat aikaisempien vuosien vertailtavuuteen, sillä täydellisiä avaimia ei kaikkien luokitusten välille voi rakentaa.

Ennen vuotta 1987 väestön taloudellista toimintaa kuvaavia kuntatasoisia tietoja on tuotettu lomakepohjaisissa väestölaskennoissa (vuosilta 1950, 1960, 1970, 1975, 1980 ja 1985). Erot rekisteripohjaisesti ja lomakepohjaisesti tuotettujen tietojen välillä ovat osoittautuneet sen verran pieniksi, että vertailtavuutta ajassa voidaan pitää suhteellisen hyvänä muiden kuin em. luokitusmuutosten vuoksi.

7. Selkeys ja eheys/yhtenäisyys

Tietoja väestön toiminnasta saadaan myös Tilastokeskuksen työvoimatutkimuksesta, joka on kuukausittain tehtävä otostutkimus. Tiedot poikkeavat keruutavasta ja työllisten päättelystä johtuen jonkin verran työssäkäyntitilaston tiedoista. Muun muassa työllisten määrä on työvoimatutkimuksessa joitakin prosentteja suurempi.

Työministeriö julkaisee tilastoa työttömien työnhakijoiden määrästä. Työministeriön työnhakijarekisterin tiedot kertovat työttömien työnhakijoiden määrän kuukauden viimeisenä arkipäivänä. Työssäkäyntitilaston tieto työttömyydestä perustuu työministeriön työnhakijarekisterin tietoihin. Siten työssäkäyntitilaston ja työministeriön luvut työttömyydestä ovat suhteellisen lähellä toisiaan.

8. Dokumentointi

Tilastossa käytetyt luokitukset löytyvät Tilastokeskuksen luokitus- ja metatietopalvelujen kotisivuilta sekä painetuista luokituskäsikirjoista.


Päivitetty 23.11.2004

Viittausohje:

Suomen virallinen tilasto (SVT): Työssäkäynti [verkkojulkaisu].
ISSN=1798-5528. 2002, Työssäkäyntitilaston laatuseloste . Helsinki: Tilastokeskus [viitattu: 28.3.2024].
Saantitapa: https://www.stat.fi/til/tyokay/2002/tyokay_2002_2004-11-23_laa_001.html