Muut työkalut

IRC kanava:
#avoindata

Onko yritystietojärjestelmän datojen avaaminen työn alla?

2 tykkää 0 ei tykkää
  • Antti Poikola
  • Points : 3360
  • Ranked : 2
  • Badges : 13 36 46
  • about.me/apoikola
  • Location : Jyväskylä
3.36K
kysytty 27. elokuuta, 2013 kategoriassa QA alusta | apoikola (3,360 pistettä) toimesta
Yritystietojärjestelmän verkkopalvelusta ytj.fi löytyy suomalaisten firmojen perustiedot. Saako niitä ladattua avoimena datana?

Opencorporates.com näyttää scrapanneen suomalaisfirmoja [1], mutta ajantasaisuuden ylläpitämisen nimissä olisi varmaankin parempi, että Patentti- ja rekisterihallitus / Verohallinto  avaisivat datan ajantasaisina julkistuksina tai mieluummin datarajapinnan kautta?

Tietääkö joku, onko PRH / Verottaja tekemässä jotain tämänsuuntaista esim. toteuttaakseen hallitusohjelmaa?

[1] http://opencorporates.com/companies/fi

PS: Tätä kysytään myös open data censuksessa http://2013.census.okfn.org/country/
muokattu 30. syyskuuta, 2013 apoikola toimesta

4 Vastausta

1 tykkäys 0 ei tykkää
  • Antti Poikola
  • Points : 3360
  • Ranked : 2
  • Badges : 13 36 46
  • about.me/apoikola
  • Location : Jyväskylä
3.36K
vastattu 27. elokuuta, 2013 | apoikola (3,360 pistettä) toimesta

Antti Eskola TEM:stä osasi ohjastaa oikeaan paikkaan: "Asia oli esillä TEMin hallinnon alan tietovarantoselvitystyöryhmässä ja raportissa kuvattu tilannetta s. 25 ja liitetaulukossa rivi 56. Pilotointia siis kaavaillaan. http://www.tem.fi/ajankohtaista/julkaisut/kaikki_julkaisut/tietovarantojen_avaaminen_tem_n_hallinnonalalla.100721.xhtml"

Suora lainaus raportista sanoo:
Patentti- ja rekisterihallituksen tietovarantojen avaamisen osalta ministeriö on kehysvalmistelujen yhteydessä ehdottanut, että tehdään pilottikokeilu avoimen rajapinnan rakentamisesta kahteen PRH:n tietovarantoon. Avoin rajapinta voitaisiin rakentaa yritys- ja yhteisötietojärjestelmästä saataviin tietoihin (edellytyksenä uudet rajapinnat) sekä PRH:n kaupparekisterin kuulutustietopalvelun tietoihin.

Pilottikokeilun avulla saataisiin kokemuksia avoimen rajapinnan määrittelystä ja siihen liittyvästä tietojärjestelmämuutoksen rakentamisesta.

Tällä hetkellä avoimen rajapinnan rakentamiskustannuksen näissä kahdessa pilotissa arvioidaan olevan 400 000 €. Tämän lisäksi YTJ-tietopalvelun maksuttomuudesta aiheutuvan pysyvän tulonmenetyksen on arvioitu olevan 75 000 € v. 2014 ja 150 000 €/v vuosina 2015-2017. Tässä arviossa on oletuksena, että YTJ-tiedot tulisivat rajapinnan kautta täysin maksuttomiksi kesällä 2014. Kokonaisuudessaan PRH:n kokeiluun on vuosina 2014-2017 arvioitu tarvittavan budjettirahoitusta yhteensä 925 000 euroa

Suomen pisteet tällä hetkellä 20/100

http://registries.opencorporates.com/jurisdiction/fi
Miten tuonne voi antaa lisätietoja? Tilanne ei ole mielestäni noin huono... julkisestihan on saatavilla dataa, missä on kaikenlaista tietoa, mutta data ei vain ole avointa (eli lisensoitu/maksuton/netissä koneluettavassa muodossa).
0 tykkää 0 ei tykkää
  • Ranked : 25569
vastattu 19. marraskuuta, 2014 | Ismo Hannula toimesta
Kyselin asiasta PRH:n tunnuspalvelusta ja sain seuraavan vastauksen:
 
"tämän hetkisen tiedon mukaan palvelu on tulossa käyttöön joulukuun aikana.  
 
Rajapinnan, jonka kautta voi hakea maksutta konekielisessä muodossa YTJ-tietoja. Palvelun tekninen rajapinta on käytettävissä HTTP-protokollan avulla ja tiedonsiirtoformaattina on Javascript Object Notation (JSON) mukainen esitystapa.  Sekä YTJ:n sivulle www.ytj.fi että PRH:n kotisivulle www.prh.fi on tulossa tiedotetta palvelusta heti kun palvelun käyttöönotto aikataulu varmistuu."
1 tykkäys 0 ei tykkää
  • Jarkko Moilanen
  • Points : 4760
  • Ranked : 1
  • Badges : 8 20 25
  • http://www.hermia.fi/opendatatre/
  • Location : Tampere, Finland
  • Community Shepherd, Open Data Tampere Region.
4.76K
vastattu 18. joulukuuta, 2014 | Jarkko Moilanen (4,760 pistettä) toimesta
0 tykkää 0 ei tykkää
  • Matti Saastamoinen
  • Points : 880
  • Ranked : 7
  • Badges : 1 5 8
  • http://twitter.com/smoinen
  • Location : Tampere
  • - Avoindata.netin perustaja - Open Data Tampere Region -projektin päällikkö - Apps4Pirkanmaa -kilpailun koordinaattori - Kuutoskaupunkien avoin data -projektin päällikkö
880
vastattu 7. tammikuuta, 2015 | smoinen (880 pistettä) toimesta
PRH on avannut avoimen datan sivunsa osoitteessa http://avoindata.prh.fi
Rajapinta YTJ-tietoihin löytyy osoitteesta http://avoindata.prh.fi/ytj.html
Että sellaisen palvelun PRH on saanut aikaan 400 000€ (näin jostain googlailin) budjetilla. Voi APUA!!  Ensinnäkin YTJ-tietojen hakeminen hakuehdoilla toimii aivan käsittämättömän huonosti. Haut käytännössä kaatuilevat jatkuvasti ja silloinkin kun hakutuloksia tulee, hauissa kestää vaikka kuinka kauan.

Ainoastaan Kaupparekisterin rajapinta, jolla haetaan listauksia yrityksistä toimii suhteellisen hyvin. Mutta YTJ-tietojen hakeminen Y-tunnuksella kestää noin 1 - 2 sekuntia ja Kaupparekisteritiedon hakeminen Y-tunnuksella noin 2-3 sekuntia.

Lisäksi palvelun kapasiteetti vaikuttaisi sellaiselta, että jos haen yhdestä rajapinnasta tietoja ja avaan esim. toiselta koneelta (eri IP-osoite) ja teen vähän toisenlaisia kyselyitä, niin molempien rajapintojen suorituskyky romahtaa. Eli aivan tukossa jo kahdella käyttäjällä.

EI VOI OLLA TOTTA ! Onko tämä projekti ostettu Tiedolta, vai kuka tämän on ryssinyt näin pahasti!

Suomessa on yrityksiä niin vähän, että käytännössä ne voisi pitää KAIKKI keskusmuistissa ja hakea sieltä 0,0001 sekunnissa. Mitä ihmettä tämmöinen sekoilu julkisella sektorilla on?
Muutama fakta:
1. Vuosia sitten eräs tampereella vaikuttava henkilö koodasi haun, joka haki ytj:n tietokannan joka yö. Tämä toimi joitain aikoja, mutta käsittääkseni henkilö sai jotain seuraamuksia - en muista mitä - oliko peräti sakkoja. Ymmärsin että teki automaattisen selainta simuloivan softan ja tuolloin ytj:ssä ei ollut estettä lukea kaikkia tietoja automaattisesti.
2. Suomeen rakennettiin 90-luvun alussa (VTK tai sitten kun VTK fuusioitiin Tietotehtaan ja Unicin kanssa TT Tiedoksi) lainsäädäntö, jolla viranomaisten hallussa oleva tieto / data tehtiin maksulliseksi. Minulle sittemmin kerrottiin mukana olleiden taholta, että haluttiin estää ulkomaisten toimijoiden liian helppo tuleminen markkinaan - olimmehan syvässä lamassa ja tämä oli varmaan tuolloin perusteltua. Näin sivusta - mutta tarkkaan - seuranneena sanoisin kuitenkin, että estettiin sekä faktapohjainen julkishallinnon johtaminen, että pk-sektorin innovatiivinen toiminta. Viittaan siihen faktaan että  organisaation koon kasvaessa riskien välttäminen johtaa lähes aina innovaatiotoiminnan tosiasialliseen alasajoon - innovaatioprosessit kun toimivat niin että asian tunteva ja innovaatiota kehittävä yksikkö joutuu anomaan budjetin johdolta, jossa monasti on heikko käsitys todellisesta potentiaalista.
HUOM: SUOMEN TILASTOT OVAT HARHAISIA JA NE EIVÄT ENNUSTA OIKEIN ISOJA ASIOITA: Esim. kaikki julkiset ja yksityiset talousennusteet ovat ennustaneet useiden vuosien ajan että "ensi vuonna tai viimeistään seuraavana tulee vientiin kasvua". Uskon että avoimen datan kautta saataisiin laajempi näkökulma asiaan. Viittaan esitelmääni EU-Russia Innovaatiofoorumissa 2011: http://www.slideshare.net/openinvest/open-data-8373432 Erityisesti huomaa tuo miten yhdistin taloustieteen Nobelistien löydökset siihen miten avoimella datalla maksimoidaan yhteiskunnan toiminta (=signalointi ja skreenaus)
3. V2010 sain soiton Fennovoimalta. Heidän salaiseksi merkitty yritysrekisterimerkintä oli mennyt julkiseksi ytj:ssä ennen aikojaan. Tiedättehän että pörssiyhtiöitä koskeva lainsäädäntö kieltää lain nojalla muita julkistamasta tietoa, ennen kuin pörssiyhtiö on itse kertonut tiedon. Julkiseksi meni ytj:ssä isoja Fennovoimaan omistajiksi lähteneitä pörssiyrityksiä, muistaakseni mm. Kesko, S yms. PRH kertoi että heillä ei ole peruutusnappulaa. Sain tuon soiton koska minulla on paljon tuttuja alalla ja selvitin 10 minuutissa miten kyseinen tieto voidaan poistaa ytj:stä julkiselta puolelta. Soittaja hankki PRH:n pääjohtaja Enäjärveltä faxin (=työtilaus) ja annoin puhelinnumeron, jossa ko. esimies ja ohjelmoija odottivat - yksi SQL-lause live-kantaan ja tieto oli ei-julkinen. Sittemmin tieto julkistettiin ytj:ssä, kun kaikki pörssiyhtiöt olivat oman julkistuksensa tehneet. En kerro kuka hoiti tuon poiston, mutta katso nykytilanne täältä: http://www.prh.fi/fi/uutislistaus/2014/P_1939.html Aikaa muuten kului n. tunti siitä, kun virhe oli tehty, sen poistamiseen - ei huono saavutus :-)
4. Luulen että tuo suoriuskyvyn romahdus voi olla tietoista halua rajoittaa ytj:n massalukua. Jos joku saa ilmaiseksi ytj:stä kaikki tiedot, niin miksi kaupaliset toimijat maksaisivat enää datoista (esim. Fonecta, Bisnode)? Toisaalta miksi tiedon pitäisi maksaa sen jälkeen kun se on jo olemassa? Verorahoillahan se tieto on ensin kerätty. Kyllä meille veronmaksajina kuuluu kaikki julkinen tieto veloituksetta käyttöön (tietosuojan puitteissa).
Tuohon kohtaan 4.  Motivaatio ostaa kaupallista dataa liittyisi varmasti siihen, että tämä avoin data on sisällöltään hyvin suppeaa.

Mutta olen sitä mieltä, että jos tieto on avointa, niin miksi sen lataamista yritetään vaikeuttaa keinotekoisesti? Ja miksi ylipäätänsä julkishallinto tekee tällaisia rajapintoja, kun eivät kuitenkaan osaa toteuttaa niitä.

Käytännössä tässäkin tapauksessa olisi riittänyt, kun nämä datat julkistettaisiin vaikka .ZIP pakettina webbisivulla ja tehköön yksityiset koodaajat/yritykset sitten hakurajapintoja, jos niin haluavat. Tähän ei olisi mennyt 400 000€, vaan ehkä 4000€, kun pohjatietona olisi voinut käyttää jo sitä kaupallisesti jaettavaa dataa.
Sisällön lisenssi:

Datatoiveet

Aiemmat datatoiveet:

Esitä datatoive!

Tietoja

Avoindata.net on pystytetty suomalaisen avoimen datan verkoston avoimeksi tukisivustoksi. Suomalaisten tietovarantojen kieli on monesti suomi. Käytä siis suomen kieltä.


Kategoriat ovat työn alla, joten jos kaipaat jotain kategoriaa, lähetä palautetta.

202 kysymystä

234 vastausta

165 kommenttia

25,568 käyttäjää

Suosituimmat tagit

Sponsorit

...