Kérsz közérdekű adatot? – Elindult az Assist, amivel gyerekjáték lesz adatokat letölteni

assist2_2

 

Történelmi időkben a kormányok és egyéb hatalmasságok sokat tesznek azért, hogy nehéz, illetve egyre nehezebb legyen hozzáférni a közérdekű adatokhoz, erről az Átlátszó olvasói minden bizonnyal értesültek már. Magyarország pedig az az ország, ahol nemhogy egyre nehezebb hozzájuk férni, hanem eleve soha nem volt könnyű!

 

800x500_
Adj SZJA 1%-ot, hogy megtudd, mire megy el az adód 99 százaléka!
18516641-1-42

 

Nézzünk egy újságírót, egy rutinosabb fajtát, mondjuk engem. Nekem, aki elég edzett vagyok az adatkeresésben, számos közérdekű adat megkeresése, kiválasztása, letöltése állított már embert próbáló feladat elé, a vége pedig olyan káromkodás lett, amilyet Bayer Zsolt sem merne már nyilvánosan leírni. Mivel találkoztam eddig az életemben?

  • Tizenhatodik aloldalra eldugott adatokkal
  • Könnyen megtalálható, mégis negyvenhárom kapcsoló megnyomása után generálódó adatokkal
  • HTML-be kódolt adatokkal, amelyet vagy valami szoftverrel kell leszedni, vagy rosszabb esetben kézzel kiírni az adatokat
  • PDF-ben feltöltött Excel-táblázatokkal
  • Prémiumszívatás: kinyomtatott, majd bescannelt, képformátumba elmentett táblázatokkal

Miért? Mi az úristenért kell ilyen akadályok elé állítani egy állampolgárt, ha ő egyszerűen két kattintás után szeretné Excelben megkapni a kívánt adatokat? Időigényes, pusztítja az agysejteket, egyáltalán nem inspirál munkára, sőt, a hasznos munkától veszi el az időt. Na, erre hoztuk létre az Assistot a Transparency Internationallel közösen, hogy időt, energiát spóroljunk újságíróknak, honpolgároknak.

Mi az Assist?

Az Assist lényegében kis robotok (ún. crawlerek) csapata, amelyek bizonyos időközönként az állami szervek honlapjáról leszednek bizonyos közérdekű adatokat, majd azokat egy felhasználóbarát, egyszerű honlapon közzéteszik, illetve Excelben letölthetővé teszik. Aki nem akarja tovább olvasni, annak itt egy bemutatkozóvideó róla:

 

 

Mivel hangsúlyosan bétaverzió (próbaverzió), ezért egyelőre csak a Nemzeti Kulturális Alap által megítélt támogatások, a Mezőgazdasági és Vidékfejlesztési Hivatal területalapú támogatásai, a Kormány.hu-n közzétett szerződések listái, négy közbeszerzésfajta eredményei érhetők el. A KSH külkereskedelmi, termékszintű és országszintű adatai pedig a napokban lesznek elérhetők.

Az adatköröket úgy választottuk ki, hogy a fejlesztőknek különféle problémákkal kelljen szembesülniük, hogy a kis robotok meg legyenek dolgoztatva. Így a robotoknak sok kapcsolót kell állítaniuk, sok kódból kell kiszűrniük a nekünk kellő információkat. Sajnos nem létezik a crawlerek Optimus Prime-ja, így nincs olyan szuperrobot, amely minden honlapról le tudná szívni az adatokat egymagában. Sajnos ahány ház, annyi szívás van, illetve annyi pici kis robotocskát kell programozni és útjukra bocsájtani.

Remek fícsörök!

A fejlesztés jelenlegi szakaszában nagyon büszkék vagyunk arra, hogy a a rendszerrel meg tudjuk mondani, hogy egy frissülő adatbázis hol és mennyiben tér el az előzőtől. Ha kikerül egy adat, vagy változik egy régi adat, akkor pirossal jelzi a rendszer a sort, ha bekerül egy új, akkor pedig zölddel. Ez arra lehet jó, ha mondjuk egy közbeszerzésfajtából hirtelen elkezdenek eltűnni egyes cégek, vagy összemenni a megítélt összegek, akkor legalább annyit tudunk majd mondani, hogy érdemes rákérdezni a Közbeszerzési Hatóságnál, hogy mi történt ezzel a közokirattal, miért változtak meg az adatok. Ha véletlenül pont mondjuk a miniszterelnök vejének az érdekeltségei töröltetnének ki a múltból, akkor pedig már csak egy oknyomozó újságíró kell, aki majd utána jár ezeknek.

 

Screen Shot 2017-02-14 at 8.57.28

 

A másik szerethető funkció, hogy ha te is rendelkezel olyan strukturált adatbázissal, amelyről azt gondolod, hogy közérdeklődésre számot tarthat, és mondjuk te állítottad össze, nem loptad, jogszerűen van nálad és jogszerűen is osztod meg, akkor feltöltheted az Assistra, és megoszthatod a nyilvánossággal. Én már meg is osztottam három ilyen adatbázist, amit eddigi munkásságom során állítottam(tunk) össze, jó médiatartalmak születtek belőlük, de miért ne használhatná őket akárki más is? Vagy miért ne tehetne hozzá? Arra buzdítunk mindenkit, cégeket, állami intézményeket is, hogy ha van ilyenjük, akkor töltsék fel és osszák meg másokkal is. A világ sokkal szebb lesz tőle, ezt garantáljuk. A feltöltéshez itt nyújtunk segítséget.

Merre tovább?

Nekünk már most rendkívül sok ötletünk van, hogy merre lehetne továbbfejleszteni az oldalt. Az egyik evidens: minél több adatkört, akár PDF-et is, hozzá akarunk kapcsolni. Most ezek futkároznak, de a mennyország az lenne, ha minél több állami intézmény egyébként elérhető adatbázisát be tudnánk vonni a későbbiekben. Szeretnénk egy értesítési rendszert, amely jelez a feliratkozó felhasználónak, ha egy általa követett adatbázis új adatokkal frissült. Szeretnénk normális tagrendszert kialakítani és bevezetni a szabadszavas keresést. De bármilyen javaslatot, kritikát szívesen fogadunk az info kukac transparency pont hu-n, vagy a batorfy.attila kukac gmail pont com-on. Ide jöhetnek a kérdések is.

Miből?

Ezekben az időkben nagyon fontos kiemelni, hogy a fejlesztést nem a magyar állam, és nem is Soros György finanszírozta, hanem a Google. Ez úgy történt, hogy az ötlettel a Google Digital News Initiative programján pályáztunk a prototípus kategóriában tizenötmillió forintra és megnyertük a Transparencyvel közösen. Ezt bárki, akár magánszemély is megteheti, ha van egy jó médiás ötlete, eszköze, fejlesztése. Ahogy az Átlátszóval is nyertünk tavaly novemberben az Üvegzsebfigyelővel. Vagy ahogy a Mérték és a Russmedia is nyert. Mi mindenképpen továbbvisszük a projektet a következő DNI-fordulóra, amely március 7-én indul.

Bátorfy Attila

Előfizetőket keresünk – támogasd a munkánkat havi 1000 forinttal!

Függetlenségünk záloga a közösségi finanszírozás. Részletek itt.

 

  • The NeverGone

    Szuperek vagytok, csak így tovább! :)

  • fudaraku

    [pacsi]