Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tietovarallisuus, joka on Suomen kilpailuetu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.

Suomen datatalous lähdössä lentoon
Datamenestyjät-kilpailun voittaja on tämän vuoden osalta valittu. Osallistuneet työt olivat hyvin mielenkiintoisia ja antavat ehkä suuntaa sille, miten datan jalostus tulevaisuudessa kehittyy. Tekniikan kehittyessä datan tallennus, siirto ja käsittely ovat halventuneet, osin muuttuneet jopa ilmaisiksi.
Nykypäivän data scientistilla on käytössään sellaiset analyysivälineet ja laskentakapasiteetti, josta parikymmentä vuotta sitten saatettiin vain haaveilla. Koodaustaitoiselle on tarjolla netissä huippuluokan analyysikirjastoja ja -rajapintoja ilmaiseksi.
Se mikä ei ole halventunut, on datan keruu. Ehkä tulevaisuudessa esimerkiksi IoT-laitteiden avulla sekin helpottuu, mutta toistaiseksi etenkin suurten, tilastolliseen käsittelyyn ja koneoppimiseen soveltuvien datajoukkojen kerääminen on kallista, hidasta ja työlästä. Siihen on varaa lähinnä suurilla vakiintuneilla toimijoilla, kuten suuryrityksillä, valtioilla ja isoilla kunnilla. Datatalous ja datan päälle rakentuvat ekosysteemit tarvitsisivat kuitenkin raaka-ainetta.
Yrityksille niiden keräämä data on kilpailuetu, ja useimmat yritykset eivät mielellään jaa sitä, etenkään ilmaiseksi. Näin ollen julkishallinnolle on jäänyt rooli tarjota jauhettavaa datatalouden myllyihin. Tämä lähtökohta on EU:n avoin data -ajattelun ytimessä.
Eurooppalainen datatalous on paljolti vielä lähtökuopissa, mutta Suomessa alamme lähestyä kriittistä pistettä, jossa siitä tulee oikeasti merkittävää liiketoimintaa.
Mikä tekee menestyvän datapalvelun? Datamenestyjät -kilpailutöissä nousee esiin ainakin kaksi ominaisuutta: visualisointi ja oikeanlainen kysymyksen asettelu.
Visualisoinnin merkitystä suurten datamäärien havainnollistajana ei voi liikaa korostaa. Perinteisesti tilastotieteilijät ovat rakastaneet numeroita, mutta eivät juurikaan ole kiinnittäneet huomiota niistä viestimiseen. Muutama pakollinen pylväs- tai viivadiagrammi on saattanut numeroiden ohesta löytyä, mutta jo karttojen käyttö on ollut kovin harvinaista. Useimmat tiedot voidaan kuitenkin kytkeä johonkin paikkaan, ja jo niiden visualisointi kartalle lisäisi tiedon arvoa huomattavasti. Tämä näkyi useassa kilpailutyössäkin.
Samoin erilaisten suhdelukujen ja suuruusluokkien hahmottaminen numeroista on vaikeaa, mutta kuvista hyvin helppoa. Visualisointi tuottaa helpolla tavalla lisäarvoa datalle.
Vaativampi, mutta vielä tärkeämpi datapalvelun ominaisuus on, että se vastaa oikeisiin kysymyksiin. Palvelun tulee tarjota käyttäjälle relevanttia tietoa ja jotain mitä ei muuten saa. Mitä paremmin palvelu vastaa johonkin tosielämän tietotarpeeseen, sitä menestyneempi se todennäköisesti on.
Toisaalta palvelun tarjoajan tulee ymmärtää, mihin kysymyksiin käytettävissä olevasta datasta voi saada vastauksen. Avoimien rajapintojen kautta saatava data on yleensä kerätty alun perin johonkin ihan muuhun käyttötarkoitukseen, jolloin sen soveltuvuus ja siitä saatava informaatio toiseen käyttöön voi olla merkittävästikin rajoittunut. Modernit edistyneet välineet kyllä laskevat tuloksia ja visualisoivatkin ne hienosti, mutta tulos voi olla täysin hyödytöntä kohinaa tai jopa valeinformaatiota.
Tällaisen datalukutaidon merkitys on kasvanut koko ajan. Jos tarvittavaa oikeaa dataa ei ole saatavilla, puutteellisestakin tiedosta saatetaan etsiä vastauksia. Erityisesti modernit koneoppimisvälineet pystyvät löytämään hämmästyttäviä yhteyksiä asioiden välillä. On kuitenkin asiantuntijan tehtävä arvioida, onko sillä merkitystä. Korrelaatio ei merkitse kausaliteettia.
Kirjoittaja työskentelee Kehittäminen ja digitalisaatio -palvelualueen ylijohtajana Tilastokeskuksessa. Hän käsittelee blogisarjassaan datan olemusta ja merkitystä nyky-yhteiskunnassa.
Lue samasta aiheesta:
Elämme aikoja, jolloin totuutta on puolustettava näkyvästi. Vastuullamme on huolehtia demokratiaa palvelevan tilastotuotannon elinehdoista: luottamuksesta ja puolueettomuudesta.
YK:n uusi suositus kansantalouden tilinpitojärjestelmäksi valmistuu vuosikymmenen puolivälissä. Tavoitteena on kuvata paremmin yhteiskuntia muuttavia ilmiöitä kuten hyvinvointi ja kestävä kehitys, globalisaatio, digitalisaatio ja sen yhteydessä esimerkiksi krypto-varojen käsittely.
This year the fundamental principles of statistical work prepared by the United Nations Statistical Commission will be 30 years old. Over the years, their importance has grown in society. The fundamental principles provide a sound basis for the management and dissemination of information, especially in the public sector.
The UN's Fundamental Principles of Official Statistics instruct statistical authorities to describe in detail how statistics have been compiled. The principle can also be used to assess the reliability of other data generated in society.
Metalleja louhitaan kasvavia määriä kehittyvän yhteiskunnan tarpeisiin. Maapallo on kuitenkin rajallinen resurssi ja metallit uusiutumaton luonnonvara. Kotitalouksien metallivarastoissa piilee palanen kiertotalouspotentiaalia.
Koronakriisi, ilmastokriisi ja talouden suhdannevaihtelut ovat nostaneet hyvinvoinnin niin poliittiseen debattiin kuin arkipäiväiseen jatkuvaan keskusteluun. Hyvinvoinnin tekijät, käsitykset ja mittarit elävät ajassa.
Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on vielä paljolti hyödyntämättä. Myös julkisten virastojen ja laitosten datapalveluiden on tulevaisuudessa oltava entistä ammattimaisempia.