Avoimesta datasta avoimia palveluja
Taloussanomat julkaisee tutkimusmaailmasta-sarjassa Aalto-yliopiston tutkijoiden ja professoreiden kirjoituksia ajankohtaisista aiheista.
Avoin data tarkoittaa internetissä julkaistua dataa, jonka käyttäminen osana palveluita on tehty laillisesti ja teknisesti mahdolliseksi. Datan julkaisemisen/avaamisen toivotaan synnyttävän erilaisia palveluita, jotka hyödyntävät dataa.
Erinomainen esimerkki tämäntyyppisestä palvelusta on HSL:n Reittiopas, joka käyttää datalähteenään pääkaupunkiseudun julkisen liikenteen aikataulutietoja. Palveluun syötetään kellonaika, nykyinen sijaintipaikka ja määränpää. Tietojen perusteella Reittiopas suosittaa nopeinta reittiä.
Reittioppaan tapauksessa palvelun rakentaja ja datan julkaisija on yksi ja sama taho, eikä palvelua alun perin suunniteltu avoimen datan ympärille. Näin ei kuitenkaan tarvitse olla. Samasta palvelusta voi myös olla useita eri versioita erilaisiin käyttötarkoituksiin. ReittiGPS on maksullinen mobiilisovellus, joka käyttää samoja datalähteitä kuin Reittiopas mutta yhdistää niihin mobiilipaikannuksen.
Tämä helpottaa ja nopeuttaa ratkaisevasti sovelluksen käyttöä esimerkiksi talvisella linja-autopysäkillä. Samalla tiedon alkuperäinen julkaisija saa omalle palvelulleen lisää käyttäjiä ja käyttäjät saavat parempia palveluita.
Toinen esimerkki on vaalidata, jonka Helsingin Sanomat on kerännyt lehteä ja verkkosivustoaan varten. Tämä data on julkaistu, ja kuka tahansa voi käyttää sitä esimerkiksi tilastojen tai grafiikoiden tekoon. Helsingin Sanomat on myös järjestänyt koodauskilpailuita, joissa pyritään tekemään ns. ohjelmointimaratonin kautta uusia sovelluksia datan hyödyntämiseen.
Avoimet
datalähteet
Kyse ei ole ilmaisesta lounaasta, vaan avoimen datan tuotanto on tyypillisesti maksettu verovaroista tai sitten data on kerätty muun toiminnan yhteydessä. Datan avaamisen arvioidaan tuottavan enemmän taloudellista kasvua kuin saman datan myyminen erikseen.
Suomessa erilaista viranomaistietoa on kerätty pitkään Se on korkealaatuista ja yleensä tallennettu siten, että sen avaaminen on mahdollista. Tämä tarjoaa erinomaisen alustan uuden palvelu- ja sovellusliiketoiminnan syntymiselle. Kansalaisille nämä palvelut voivat olla aidosti hyödyllisiä ja jopa elämänlaatua parantavia.
Mistä uutta dataa palveluiden rakentamiseen sitten saataisiin? Yksi mahdollinen lähde ovat luonnollisesti julkiset tietokannat. Suomen Tilastolaissa on määritelty neljä valtion virastoa, jotka huolehtivat yhteiskunnan tilastojen laatimisesta "kansalaisten ja yhteisöjen käyttöön": Tilastokeskus, Maa- ja metsätalousministeriön tietopalvelukeskus, Terveyden ja hyvinvoinnin laitos sekä Tullihallitus. Ajatuksena on tarjota tilastotietoa tukemaan yhteiskunnallista päätöksentekoa ja koota Suomea koskevat kansainväliset tilastot.
Tuntuisi luonnolliselta, että ainakin valtion keskeisimmät tietopalvelut velvoitettaisiin avaamaan tietonsa ja tuottamaan myös ohjelmointirajapinnat, joiden kautta tiedot ovat helposti hyödynnettävissä. Tämä rohkaisisi kehittäjiä ja yrityksiä hyödyntämään dataa. Koska tuotanto on lailla säädelty, voidaan myös olettaa, että datan päälle rakennettavia palveluita pystytään käyttämään pitkän aikaa.
Näin ei kuitenkaan ole. Viranomaiset ovat olleet sangen haluttomia julkaisemaan keräämäänsä tietoa, vaikka niin hallitusohjelma, Valtioneuvoston periaatepäätös kuin muutkin tahot ovat siihen patistelleet. Virastoissa ajatellaan, että aineistojen myynti tuo rahaa ja niiden antaminen vapaaseen käyttöön olisi omasta pussista pois. Näin voi yhden organisaation näkökulmasta ollakin, mutta samalla virastot jarruttavat palvelukehitystä. Erityisen ongelmallinen tilanne on silloin, kun tulovirta koostuu muilta valtion virastoilta kerättäviltä maksuilta. Palveluita, uusia yrityksiä, työpaikkoja ja talouskasvua jää syntymättä, mutta verovaroja kuluu.
Useissa maissa, esimerkiksi Yhdysvalloissa, julkisesti rahoitetuissa hankkeissa kerätty data on määritelty julkiseksi ja se tulee saattaa kansalaisten vapaasti käytettäväksi. Tämä on järjestetty hakemistopalvelujen tai instituutioiden kautta. Tässä yhteydessä on syytä myös muistuttaa internetin historiasta: koko World Wide Web on alunperin syntynyt CERN:issä tieteellisten havaintojen julkista jakelua varten.
Suomessa on hyvin paljon dokumentoitua ja luokiteltua tietoa myös museoissa, kirjastoissa ja eri kulttuuri-instituutioissa. Tämä data on pääosin julkisin varoin tuotettua ja merkittävä tietoreservi, jonka vapauttaminen synnyttäisi täysin uudenlaisia palveluita.
Palvelukehityksen
eri vaiheet
Mielenkiintoinen piirre avointa dataa hyödyntävissä palveluissa on, että monet niistä ovat - tai voisivat olla - suunniteltu palvelemaan kaksipuolisia markkinoita. Kaksipuolisissa markkinoissa taloudellinen alusta palvelee kahta erillistä käyttäjäryhmää, jotka tavalla tai toisella kommunikoivat keskenään alustan välityksellä. Jos tällaisia alustoja ja markkinoita syntyy, ne takaavat sen, että tiedot pysyvät saatavilla ja uusien palveluiden kehitys on mielekästä.
Kaksipuolisilla markkinoilla palvelu tarjotaan tyypillisesti ilmaiseksi toiselle puolelle markkinoita, eli vaalidata-esimerkissä kuluttajille ja ReittiGPS:ssä liikenneyhtiöille, ja toinen puoli maksaa (tavalla tai toiselle) alustan tarjoajalle. Avoin data mahdollistaa palvelun tarjoamisen ja subventoinnin ja mahdollinen tuotto saadaan mainoksista (HS) tai sovelluksen myynnistä (ReittiGPS). Tuottovaatimus markkinoilla toimiville on pienempi, koska raakadata ohjelmointirajapintoineen on palveluntarjoajalle ilmainen.
Muita esimerkkipalveluita voisivat olla vaikkapa datan puhdistaminen ja anonymisointi, konsultointi, datan kokoaminen (aggregointi) sekä erilaiset sovellusten ja mainosten myynti. Valitut esimerkit eivät ole ainoita avointa dataa hyödyntäviä palveluita.
Palvelujen ideoinnin ja kaupallistamisen lisäksi tarvitaan aktiivisia toimia avoimen datan luomiseksi ja saatavuuden varmistamiseksi. Markkinoiden kaksipuolisuus tekee liiketoimintamallien miettimisestä erityisen vaikeaa, koska eri käyttäjäryhmien tarpeita on mietittävä erikseen. Varmaan kuitenkin on, että palvelukehitys hidastuu, ellei dataa avata.
Matti Rossi, professori, Aalto-yliopiston Kauppakorkeakoulu
Juho Lindman, tutkijatohtori, Hanken
Virpi Tuunainen, professori, Aalto-yliopiston Kauppakorkeakoulu













