tk-icons
Sivuston näkymät

Liikevaihtokuvaajat nopeutuvat – tarkempi suhdannekuva kuukautta lyhemmällä viiveellä

14.3.2019
Twitterissä: @LArhosalo

Tammikuun tiedoista lähtien liikevaihtokuvaajien laskennassa otetaan käyttöön aikasarjamallinnusta hyödyntävä estimointimenetelmä, jonka ansiosta indeksit voidaan julkaista kuukautta nopeammin kuin aiemmin. Uudistuksen myötä tieto suhdannekehityksestä tarkentuu.

Liikevaihtokuvaajat perustuvat Verohallinnolta saatavaan oma-aloitteisten verojen aineistoon, joka saapuu Tilastokeskukselle noin 50 päivää viiteajankohdan jälkeen. Lisäksi veroaineistoa täydennetään Tilastokeskuksen myyntitiedustelulla, joka kohdistuu noin 2 000 suurimmalle yritykselle.

Myyntitiedustelun aikataulu on veroaineistoa nopeampi, minkä ansiosta mm. suurten yritysten liikevaihtoennakko ja vähittäiskaupan pikaennakko saadaan julkaistua muita liikevaihtokuvaajia aikaisemmin.

Teollisuuden, palveluiden ja rakentamisen liikevaihtokuvaajat on aiemmin julkaistu noin kaksi ja puoli kuukautta viiteajankohdan jälkeen. Kaupan osalta on julkaistu vähittäiskaupan pikaennakko kuukauden sisällä sekä kattavammat ennakkotiedot noin puolitoista kuukautta viiteajankohdan jälkeen.

Tarkemman toimialatason tiedot on kuitenkin kaupastakin julkaistu noin kahden ja puolen kuukauden viiveellä. Julkaisuaikataulu on johtunut aineiston toimittamisen aikataulusta.

Nyt käyttöön otettavassa estimointimenetelmässä pyritään aikasarjamallinnuksen avulla päättelemään käytettävissä olevien aineistojen sekä liikevaihdon aikaisemman kehityksen perusteella seuraavaksi julkaistava indeksipisteluku.

Mallinnuksessa hyödynnetään kertyneitä liikevaihtotietoja, palkkasummakuvaajien käyttämiä palkkatietoja sekä myyntitiedustelun tietoja. Tavoitteena on saada estimoitua sellainen indeksipisteluku, joka on mahdollisimman lähellä lopullista pistelukua ja joka revisoituisi mahdollisimman vähän.

Revisoitumisella eli tietojen tarkentumisella tarkoitetaan sitä, että ensimmäisen julkaisukerran indeksipisteluku ei ole lopullinen vaan se tarkentuu tulevilla julkaisukerroilla sitä mukaa, kun aineistoa kertyy lisää tai sitä korjataan.

Tietojen tarkentuminen lasketaan ensimmäisen julkaisukerran vuosimuutoksen ja viimeisimpänä julkaistun vuosimuutoksen itseisarvoisena erotuksena. Jatkossa julkaisuviive on 1,5 kuukautta.

Estimointi avuksi aineiston hitaaseen kertymiseen

Erityisesti rakentamisen liikevaihtokuvaajalle on tyypillistä, että julkaistut luvut tarkentuvat melko pitkään. Alkuperäisen liikevaihtosarjan indeksipistelukua voi pitää lopullisena noin vuoden päästä ensimmäisestä julkaisusta.

Tarkentuminen johtuu mm. Verohallinnolta saatavan aineiston kertymisestä. Aineisto kertyy hitaasti ja toisaalta yritys voi korjata takautuvasti antamiaan arvonlisäveroilmoituksia sekä myyntitiedustelutietoja.

Muita tarkentumiseen vaikuttavia tekijöitä ovat toimialamuutokset sekä yritysjärjestelyiden käsittely laskennassa, mutta näiden merkitys lienee melko vähäinen aineiston kertymiseen verrattuna. Tilastotuotannossa seurataan säännöllisesti aineiston käsittelystä johtuvaa tietojen tarkentumista.

Koska uudessa laskentamenetelmässä pyritään estimoimaan lopullinen indeksipisteluku, voidaan hitaasta aineiston kertymisestä johtuvaa tietojen tarkentumista pienentää.

Estimointimenetelmällä ei pystytä eliminoimaan muita tarkentumiseen vaikuttavia tekijöitä, koska esimerkiksi toimialamuutokset ja yritysjärjestelyt eivät ole ennakoitavissa.

Estimointimenetelmien luotettavuus vaihtelee toimialoittain

Uuden laskentamenetelmän käyttöönoton eteen on työskennelty Tilastokeskuksella eri kehittämisprojekteissa jo muutaman vuoden ajan.

Estimointimalleja on tuotettu erilaisilla viiveillä ja tarkasteltu niiden osuvuutta vertailemalla tietojen tarkentumista aiemmin käytössä olleen laskentamenetelmän vastaaviin (tarkentumista kuvaaviin) lukuihin. Estimointimenetelmän tietojen tarkentumista voidaan nimittää selvyyden vuoksi estimointivirheeksi.

Kaikkien kuukausien keskiarvona laskettavan keskimääräisen estimointivirheen lisäksi estimointimalleja on tarkasteltu kuukausitasolla: vaikka joku malli tuottaisi keskimääräisesti pienimmän estimointivirheen, sen käytettävyys tilastotuotannossa on heikko, jos yksittäisinä kuukausina ilmenee suuria estimointivirheitä.

Artikkelin taulukot havainnollistavat eri menetelmien vertailua eri toimialojen osalta. Sarakkeessa 1 esitetään estimointivirhe eli keskimääräinen tietojen tarkentuminen estimointimenetelmässä ja sarakkeessa 2 keskimääräinen tietojen tarkentuminen menetelmästä, jossa estimointia ei käytetä. Sarakkeiden 1 ja 2 vertailu kertoo, kumpi menetelmä on tarkempi (eli tietojen tarkentuminen on pienempää) samalla puolentoista kuukauden viiveellä.

Sarakkeessa 3 esitetään keskimääräinen tietojen tarkentuminen kahden ja puolen kuukauden viiveellä menetelmästä ilman estimointia, mikä vastaa liikevaihtokuvaajien julkaisuhetken tilannetta ennen maaliskuista uudistusta. Estimointivirheen vertaaminen sarakkeen 3 lukuihin kuvastaa, miten keskimääräinen tarkentuminen muuttuu uudistusta edeltävään tilanteeseen verrattuna, samalla kun viive lyhenee kuukaudella.

Kaikki artikkelin taulukoiden luvut on laskettu aikaväliltä 01/2015 – 06/2018. Sarakkeen 1 estimointivirhe on laskettu jokaisen kuukauden viimeisimmän julkaistun vuosimuutoksen ja kyseiselle kuukaudelle estimoidun vuosimuutoksen välisten erotusten itseisarvojen keskiarvona.

Sarakkeen 2 luvut on laskettu viimeisimmän julkaistun vuosimuutoksen ja puolitoista kuukautta kertyneellä aineistolla tuotetun indeksin vuosimuutoksen erotuksien itseisarvoista keskiarvona. Sarakkeessa 3 on vastaavasti viimeisimmän julkaistun vuosimuutoksen erotukset kaksi ja puoli kuukautta kertyneen aineiston perusteella tuotetun indeksin vuosimuutoksesta ja laskettu näistä itseisarvojen keskiarvo.

Kesäkuun 2018 jälkeisiä kuukausia ei ole otettu laskentajaksoon mukaan, koska tätä tuoreemmat kuukaudet eivät ole kaikilla toimialoilla vielä riittävän lopullisia, jotta niiden perusteella kannattaisi vertailla estimointi­menetelmän toimivuutta.

Taulukko 1. Tietojen tarkentuminen eri menetelmillä ja viiveillä rakentamisen toimialoilla. Laskentajakso 01/2015–06/2018.
Toimiala (TOL 2008) Tietojen
tarkentuminen
estimointi-
menetelmällä
viive 1,5 kk
Tietojen
tarkentuminen
menetelmällä ilman
estimointia,
viive 1,5kk
Tietojen
tarkentuminen
menetelmällä
ilman
estimointia,
viive 2,5 kk
41 Talonrakentaminen 1,8 3,5 1,8
42 Maa- ja vesirakentaminen 2,7 4,2 2,5
43 Erikoistunut rakennustoiminta 1,8 2,2 1,6

Taulukosta 1 havaitaan, että rakentamisen kaikilla alatoimialoilla estimointi parantaa tarkkuutta huomattavasti, kun verrataan samalla puolentoista kuukauden viiveellä laskettuun indeksiin ilman estimointia.

Kuukauden pidempään kertynyt aineisto eli kahden ja puolen kuukauden viiveellä laskettu indeksi tarkentuu vain hiukan vähemmän kuin estimointimenetelmä kuukautta aiemmin.

Julkaisuviiveen lyhentäminen kuukaudella voi näkyä tarkentumisen hienoisena kasvuna, mutta on muistettava että tarkentuminen kasvaisi huomattavasti enemmän, jos julkaisuviivettä lyhennettäisiin ilman estimointia.

Ensimmäisen julkaisukerran tiedon tarkentuminen seuraavaan julkaisukertaan voi joillakin toimialoilla siis olla suurempaa kuin ennen uudistusta. Tämä on nopeammin saatavan tiedon kääntöpuoli.

Julkaistavan tiedon nopeutta kuitenkin toivotaan käyttäjäpalautteen mukaan, vaikka tietojen tarkentuminen voi tietyillä toimialoilla yksittäisinä kuukausina olla suurtakin.

Tietokantataulukoihin merkitään ne toimialat, joilla estimoituihin uusimpiin kuukausiin tulee suhtautua varauksella. Merkintärajana pidetään yli 2 prosenttiyksikön keskimääräistä revisiota vuosimuutokseen.

Estimointimenetelmien toimivuutta tullaan tarkastelemaan säännöllisesti, ja tietojen tarkentumisen kehitystä seurataan tilastotuotannon yhteydessä. Tähänastisten tarkastelujen perusteella tilanne elää sitä mukaa, mitä pitemmältä ajanjaksolta vertailuaineistoa kertyy.

Teollisuudessa nopeutuvat aluksi ainoastaan liikevaihtotiedot

Teollisuuden liikevaihtokuvaaja julkaistaan jatkossa puolentoista kuukauden viiveellä niin kuin muidenkin toimialojen liikevaihtokuvaajat. Teollisuudessa nopeutuvat kuitenkin aluksi ainoastaan liikevaihtotiedot.

Vientiliikevaihto ja kotimaan liikevaihto julkaistaan toistaiseksi edelleen kahden ja puolen kuukauden viiveellä. Tämä johtuu siitä, että vientiliikevaihdon ja kotimaan liikevaihdon estimoiminen on hankalampaa kuin liikevaihdon.

Näiden muuttujien osalta myös tietojen tarkentuminen tulee todennäköisesti olemaan suurempaa. Pyrimme kuitenkin kehittämään myös vientiliikevaihdon ja kotimaan liikevaihdon osalta mahdollisimman laadukkaita estimointimenetelmiä.

Vientiliikevaihto ja kotimaan liikevaihto on tarkoitus julkaista puolentoista kuukauden viiveellä ensi vuoden aikana.

Teollisuuden toimialoilla estimointimenetelmät toimivat keskimäärin hyvin. Taulukossa 2 on esimerkkejä muutamista teollisuuden toimialoista, joissa estimointimenetelmät selvästi vähentävät tietojen tarkentumista.

Estimointimenetelmien avulla puolentoista kuukauden viiveellä julkistettavien tietojen tarkentumisessa päästään suhteellisen lähelle kahden ja puolen kuukauden viiveellä julkistettavien tietojen tarkkuutta.

Taulukko 2. Tietojen tarkentuminen eri menetelmillä ja viiveillä teollisuuden toimialoilla. Laskentajakso 01/2015–06/2018
Toimiala (TOL 2008) Tietojen
tarkentuminen
estimointi-
menetelmällä
viive 1,5 kk
Tietojen
tarkentuminen
menetelmällä
ilman estimointia,
viive 1,5kk
Tietojen
tarkentuminen
menetelmällä
ilman estimointia,
viive 2,5 kk
13 Tekstiilien valmistus 1,4 4,2 1,3
16 Sahatavaran, puu- ja korkkituotteiden valm. (pl. huonekalut) 1,3 2,6 0,8
25 Metallituotteiden valmistus (pl. koneet ja laitteet) 1,4 4 1,2
28 Muiden koneiden ja laitteiden valmistus 1,5 2,7 0,9
38 Jätteen keruu, käsittely ja loppusijoitus; kierrätys 1,4 3,2 0,6

Kaupan tarkemmat toimialat julkaistaan jatkossa aiemmin

Osa kaupan liikevaihtokuvaajan toimialoista on julkaistu jo aiemminkin vähintään puolentoista kuukauden viiveellä. Uudistusten myötä jatkossa kaikki kaupan liikevaihtokuvaajassa julkaistavat toimialat julkaistaan noin puolentoista kuukauden viiveellä.

Osalla toimialoista puolentoista kuukauden viiveellä julkaistava tieto on laadultaan heikompi kuin kahden ja puolen kuukauden viiveellä julkaistava tieto, mutta toimialat, joiden tuoreimpaan tietoon tulisi suhtautua varauksella, merkitään tietokantataulukoihin.

Taulukko 3 kuvaa tietojen tarkentumista muutamilla kaupan toimialoilla eri menetelmillä ja julkaisuajankohdilla. Usealla toimialalla uusi estimointimenetelmä parantaa puolentoista kuukauden viiveellä tuotettuja tietoja merkittävästi, mutta tietojen tarkentuminen on kuitenkin suurempaa kun kahden ja puolen kuukauden viiveellä julkaistuissa tiedoissa.

Taulukko 3. Tietojen tarkentuminen eri menetelmillä ja viiveillä muutamilla kaupan toimialoilla. Laskentajakso 01/2015–06/2018
Toimiala (TOL 2008) Tietojen
tarkentuminen
estimointi-
menetelmällä
viive 1,5 kk
Tietojen
tarkentuminen
menetelmällä
ilman estimointia,
viive 1,5kk
Tietojen
tarkentuminen
menetelmällä
ilman
estimointia,
viive 2,5 kk
Moottoriajoneuvojen vähittäiskauppa (45112, 45192, 45321, 45322, 45402) 1 1,2 0,3
Elintarvikkeiden vähittäiskauppa erikoismyymälöissä (472 pl. 4725) 1,7 2,9 1
Ajoneuvojen polttoaineen vähittäiskauppa (473) 1,2 1,6 0,7
Vaatteiden ja jalkineiden vähittäiskauppa (4771, 4772) 1,1 1,3 0,8
Rautakauppatavaroiden vähittäiskauppa (4752, 47532, 47596) 1,3 1,9 0,8
Huonekalujen yms. vähittäiskauppa (47511-12, 47531, 47591-94, 47599) 1,4 1,4 0,4
Kirjojen, sanomalehtien ja paperitavaran vähittäiskauppa (47610, 47621-22) 1,9 1,9 0,6
Urheiluvälineiden vähittäiskauppa (47641) 1,8 3,1 0,9
Apteekit, terveydenhoito-, kosmetiikka- ja hygieniatuott. väh.kauppa (4773-5) 1,4 2,5 0,8
Kukkien, kasvien ja puutarha-alan vähittäiskauppa (47761, 47762, 47763) 2,9 3,9 1,2
Kultasepänteosten ja kellojen vähittäiskauppa (4777) 3,5 6,8 1,2
Optisen alan vähittäiskauppa (47783) 1,9 3,3 0,5

Aiemminkin puolentoista kuukauden viiveellä julkaistavien toimialojen tietojen laatu voi uusien estimointimenetelmien johdosta myös hieman parantua. Päivittäistavarakaupan ja vähittäiskaupan kuukauden sisällä julkaistavat ennakkotiedot julkaistaan kuten nykyäänkin.

Palvelualojen liikevaihto nopeutuu ja laatu paranee

Palvelualojen liikevaihdon julkaisun nopeutuminen kuukaudella on tilaston käyttäjille merkittävä parannus tiedonsaannin viiveessä. Estimointimenetelmien ansiosta ei julkaistavan tiedon laadusta ole kuitenkaan tarvinnut tinkiä.

Tehtyjen tarkasteluiden perusteella osalla toimialoista pystytään tuottamaan estimointimenetelmillä kuukautta nopeammin jopa laadukkaampia tietoja kuin nykyisellä kahden ja puolen kuukauden viiveellä.

Taulukossa 4 on esitetty joitain palvelutoimialoja, joiden pidemmän aikavälin keskivirheet näyttävät pienenevän tai pysyvän liki samalla tasolla nykyiseen julkaisuviiveeseen nähden.

Merkittävimmin estimointimenetelmät näyttävät parantavan kiinteistöalan, lakiasian ja laskentatoimen palveluiden sekä muut erikoistuneet palvelut liike-elämälle toimialan osuvuutta.

Estimointimenetelmien merkityksen havaitsee parhaiten tarkasteltaessa samalla aikaviiveellä tuotettujen estimoitujen ja estimoimattomien tulosten tietojen tarkentumista. Verrattaessa estimointivirheitä vastaaviin puolentoista kuukauden viiveellä tuotettuihin estimoimattomiin tietoihin, nähdään estimoinnin parantavan selvästi kaikkien taulukossa tarkasteltujen toimialojen laatua.

Menetelmällistä aikasarjamallinnusta tullaan jatkossa käyttämään kaikilla palvelualojen toimialoilla puolentoista kuukauden viiveellä julkaistavissa tiedoissa.

Moni palvelualojen tarkemmista toimialoista on kuitenkin varsin pieniä ja suhdanneherkkiä, joten niissä tapahtuvien muutosten estimoiminen kuukausitilastossa saattaa osoittautua haastavaksi. Valtaosalla toimialoista estimaattien käyttö kuitenkin parantaa tietojen osuvuutta ja nopeutunut suhdannetieto on nähty tilastonkäyttäjää parhaiten palvelevaksi. Tuoreen tiedon epävarmuudesta tullaan tiedottamaan julkaistujen tietojen yhteydessä.

Taulukko 4. Tietojen tarkentuminen eri menetelmillä ja viiveillä palveluiden toimialoilla. Laskentajakso 01/2015–06/2018.
Toimiala (TOL 2008) Tietojen
tarkentuminen
estimointi-
menetelmällä
viive 1,5 kk
Tietojen
tarkentuminen
menetelmällä
ilman estimointia,
viive 1,5kk
Tietojen
tarkentuminen
menetelmällä
ilman estimointia,
viive 2,5 kk
49 Maa- ja rautatieliikenne 0,7 2 0,8
58 Kustannustoiminta 1,4 2,7 2
60 Radio- ja televisiotoiminta 1,5 3,4 2,3
63 Tietopalvelutoiminta 3,4 4,8 3,9
68 Kiinteistöalan toiminta 1,3 2,6 2,5
69-70 Lakiasiain- ja laskentatoimen palv.; liikk.johdon konsult. 1,4 2,6 2,5
74 Muut erikoistuneet palvelut liike-elämälle 2,8 5,9 4,3

Menetelmiä testattu vuodesta 2017 lähtien

Aikasarjamallinnuksella on pyritty pienentämään aineiston hitaasta kertymisestä johtuvaa virhettä. Menetelmiä on testattu tuotannon rinnalla reaaliaikaisesti 2017 alkuvuodesta lähtien. Menetelmien avulla pyritään mallintamaan kunkin toimialan vuosimuutosta mahdollisimman harhattomasti.

Pääosa käytetyistä estimointimalleista pohjautuu Arima-aikasarjamallinnukseen. Aikasarjaan on yhdistetty erilaisia selittäviä tekijöitä. Arima-mallinnuksen lisäksi on käytetty regressiomallinnusta ottamatta aikasarjan rakennetta huomioon (myöh. Staattinen regressiomalli), sekä erilaisia koneoppimiseen pohjautuvia malleja (Ridge, Lasso, Elastic-Net).

Estimointimallien selittäjinä käytetään pääkomponenttianalyysillä muodostettuja faktoreita. Näissä on käytetty hyväksi sekä myyntitiedustelun liikevaihtoaineistoa että verottajan palkkasumma-aineistoa. Lisäksi osassa malleista pääkomponenttianalyysissä käytettävä yritysryhmä rajataan käsittämään pelkästään kyseisen toimialan yritykset ja osassa kaikki yritykset ovat mukana selittäjinä.

Näistä on käytetty erilaisia variaatioita, esimerkiksi ennustettu koko toimialaa yhtenäisenä ryhmänä tai jaoteltu yrityksiä alaryhmiin: pienet yritykset (joiden aineisto kertyy hitaammin) ja suuret, joilta verottajan aineiston lisäksi pystytään hyödyntämään Tilastokeskuksen myyntitiedusteluun pohjautuvaa aineistoa.

Pääkomponenteissa käytetty lähdeaineisto on tarkastettu, jolloin on puhdistettu selkeät virheet ja puuttuvat havainnot. Mukana on pidetty vain yritykset, joilla on puhdas aikasarja vuodesta 2000 lähtien. Tämä valinta sulkee pois aloittavat ja lopettavat yritykset.

Tässä kuvatuista malleista valitaan kuukausittain parhaat mallikombinaatioon, josta muodostuu toimialan lopullinen estimaatti vuosimuutokselle. Mallikombinaation valinta perustuu testiaineistoon, joka käsittää aiemmat estimaatit, joita verrataan sen hetken tuoreimpaan tietoon. Näin valitaan sekä eri kombinaatioiden sisältämät mallit että parhaiten toimiva kombinaatio. Kombinaatioita ovat esimerkiksi yhdistelmä viidestä tai kymmenestä parhaasta mallista.

Mallikombinaatioiden on todettu toimivan yleensä paremmin kuin yksittäisten estimointimallien. Lisäksi estimointimallien ”hajauttaminen” pienentää riskiä yksittäisiin isoihin virheisiin.

Ilman estimointia, puolentoista kuukauden viiveellä tuotettu vuosimuutos (vanha menetelmä) toimii vertailukohtana estimointimalleille. Osalla toimialoista - tosin selkeällä vähemmistöllä - se toimii paremmin kuin mikään estimointimalleista. Näillä toimialoilla käytetään luonnollisesti tätä. Yksi kombinaatio muodostetaan malleista, jotka alittavat vanhan menetelmän keskivirheen. Yhteen taas valikoidaan parhaat 25 prosenttia ennusteista, muihin parhaat kymmenen, viisi ja vain paras ennuste.

Pienet yritykset omana sarjanaan

Yritykset jakautuvat luontevasti kahteen ryhmään aineistolähteen perusteella. Pienet yritykset, joilta saadaan vain verottajan oma-aloitteisten verojen (OAV) aineistoa tulevat indeksisarjoihin mukaan viiveellä. Suuret yritykset, jotka ovat mukana myyntitiedustelussa, ovat mukana aiemmin. On mahdollista, että kyseiset ryhmät käyttäytyvät keskenään eri tavalla. Näin ollen jakamalla yritykset kahteen ryhmään eli estimoimalla pienten yritysten kehitys ja käyttämällä hyväksi suurten yritysten myyntitiedustelu-tiedoista laskettua vuosimuutosta, tulee näiden ryhmien erilaisuus huomioitua liikevaihdon kehitystä mallinnettaessa.

Yritysryhmät eivät vaihdu kesken estimoitavan jakson. Mallinnuksessa yritys katsotaan myyntitiedustelu-yritykseksi, jos siltä löytyy myyntitiedustelun tietoa aikasarjassa käytettävältä aikaväliltä. Yksittäiset puuttuvat havainnot korvataan käyttämällä verottajalta saatavaa oma-aloitteisten verojen aineistoa.

 

Kirjoittajat työskentelevät yliaktuaareina Tilastokeskuksen yritystilastot-yksikössä.

 

Aikasarjamalleista on kerrottu tarkemmin menetelmäraportissa (englanniksi).

Tilaa Tieto&trendit-juttukooste sähköpostiisi

Kommentit