Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Avoin data – harrastetoiminnasta julkiseksi palveluksi

17.8.2021
Twitterissä: @LindholmMikko
Kuva: Eeva Anundi

Data on uusi öljy, sanotaan. Se ei tarkoita vain sitä, että data on arvokasta ja sen omistajuudesta taistellaan. Data on myös yhteiskunnan käyttövoima ja voitelija. Kaikki toiminta yhteiskunnassa kuluttaa ja tuottaa dataa, ja kaikenlaista toimintaa voidaan myös sujuvoittaa datan avulla.

Esimerkiksi verkkokauppaostoksessa käytetään kauppiaan tuoteluetteloa ja ostajan käyttäjäprofiilia sekä tuotetaan uutta ostotapahtumatietoa. Tilaamista voidaan sujuvoittaa vaikkapa tunnistamalla asiakkaan sijainti ja listaamalla lähellä olevat toimituspisteet. Logistiikkaakin optimoidaan datalla. 

Dataan perustuvat toimintamallit ovat jo niin yleisiä, että yhteiskuntamme ei toimi enää ilman jatkuvia datavirtoja. Ja vauhti vain kiihtyy. Tiedolla johtamisen filosofia on sisäistetty niin yritysten kuin julkishallinnonkin johdossa. Päätöksentekijät kaipaavat yhä enemmän dataa, yhä useammista aihealueista ja yhä nopeammalla syklillä. Dataa tuottavat organisaatiot, kuten Tilastokeskus, ovat helisemässä uusien vaatimusten paineissa. Maailma vaatii polttoainetta, muuten pyörät pysähtyvät. 

Kun aloittelin työuraani ohjelmistokehittäjänä 198090-lukujen vaihteessa, työtäni rajoitti käyttökelpoisen datan puute. Tein kartta- ja tilastografiikkasovelluksia, mutta oli erittäin vaikeaa löytää käyttökelpoista dataa edes testaustarkoituksiin. Kaikki tieto oli suljetuissa järjestelmissä, eksoottisissa tiedostomuodoissa. Jos jotain oli saatavilla, se oli hyvin kallista. Digitaalinen talous kehittyi kovin hitaasti. 

Nykyisin tilanne on parempi. Lähes kaikki julkishallinnon organisaatiot julkaisevat avointa dataa sivuillaan. Kansainväliset organisaatiot, kuten OECD tai Maailmanpankki, tarjoavat paljon dataa. Myös useat kaupalliset toimijat, kuten pörssit, tuovat tapahtumadataa saataville API-rajapinnan kautta. Monelle yritykselle data on kuitenkin kriittinen kilpailutekijä, joten ne eivät edelleenkään ole halukkaita julkaisemaan dataansa muille.  

Lisääntynyt datan määrä tuo uusia haasteita. Yksi merkittävä ongelma avoimesti saatavilla olevissa datoissa on niiden yhteensopivuus. Jokainen toimija julkaisee dataa omista lähtökohdistaan ja itselleen sopivilla käytännöillä. Näin ollen tietojoukkojen kattavuus, tietomallien yhteensopivuus sekä ajallinen tai aggregointitason yhteensopivuus voivat olla heikkoja.

Tiedostoformaattiongelmista on onneksi jo enimmäkseen päästy. Jonkinlaista kehikkoa tai kokonaisarkkitehtuuria kuitenkin kaivattaisiin, jotta dataa yhdistelevät palvelut voivat järkevästi toimia.  

Datatalouden toimijoiden uskottavuus edellyttää myös datalähteiden julkistamista. Tarvitaan avoimesti tietoa siitä, mitä datajoukkoa käytetään, kuka datan on tuottanut, ja koska se on ladattu tai luettu rajapinnasta. Erityisen tärkeää tämä on siinä vaiheessa, kun aletaan yhdistelemään datoja eri tiedontuottajilta. Käytetyn tiedon laatu ja luotettavuus on kyettävä osoittamaan selkeästi ja siten, että kuka tahansa kuluttaja sen ymmärtää. Lopputulos voi olla vain niin hyvä kuin huonoin käytetty data.

Haasteista huolimatta avoimen datan palveluista on muotoutumassa vähitellen uutta digitaalista julkista infrastruktuuria valmiiden asiointi- ja tiedotuspalveluiden rinnalle. Mitä enemmän ja parempilaatuista dataa on saatavilla, sitä parempia palveluita niiden varaan voidaan rakentaa.

Olemme vasta kehityksen alkutaipaleella, mutta esimerkiksi Sovellukset - avoindata.fi sivusto tarjoaa jo esimerkkejä siitä, mikä on mahdollista. Avoimen datan potentiaalia uuden digitalouden käyttövoimana ja mahdollistajana on kuitenkin vielä paljolti hyödyntämättä. Tulevaisuudessa datapalveluiden on oltava entistä ammattimaisempia, ja niiden tulee nousta virastojen ja laitosten muiden toimintojen rinnalle olennaiseksi osaksi toimintaa. 

 

Kirjoittaja työskentelee Kehittäminen ja digitalisaatio -palvelualueen ylijohtajana Tilastokeskuksessa. Hän käsittelee blogisarjassaan datan olemusta ja merkitystä nyky-yhteiskunnassa.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
12.1.2023
Markus Sovala

Suomessa on laadukkaat rekisterit. Niistä saatavaa tietoa yhdistelemällä syntyy tieto­varallisuus, joka on Suomen kilpailu­etu. Sitä hyödyntämällä teemme parempia päätöksiä tulevaisuudessa.  

Blogi
23.3.2022
Tuomas Rothovius

YK:n uusi suositus kansantalouden tilinpito­järjestelmäksi valmistuu vuosikymmenen puolivälissä. Tavoitteena on kuvata paremmin yhteiskuntia muuttavia ilmiöitä kuten hyvinvointi ja kestävä kehitys, globalisaatio, digitalisaatio ja sen yhteydessä esimerkiksi krypto-varojen käsittely.

Blogi
7.3.2022
Leena Storgårds

This year the fundamental principles of statistical work prepared by the United Nations Statistical Commission will be 30 years old. Over the years, their importance has grown in society. The fundamental principles provide a sound basis for the management and dissemination of information, especially in the public sector.

Blogi
28.2.2022
Outi Ahti-Miettinen

The UN's Fundamental Principles of Official Statistics instruct statistical authorities to describe in detail how statistics have been compiled. The principle can also be used to assess the reliability of other data generated in society. 

Blogi
29.9.2021
Mikko Lindholm

Alamme Suomessa lähestyä kriittistä pistettä, jossa datataloudesta tulee oikeasti merkittävää liiketoimintaa. Mikä sitten tekee menestyvän datapalvelun? Datamenestyjät -kilpailutöissä nousee esiin ainakin kaksi ominaisuutta: visualisointi ja oikeanlainen kysymyksen asettelu. 

tk-icons