A Nemzeti Választási Iroda eddig nem tett közzé statisztikailag elemezhető hivatalos adatbázist a választási eredményekről. Csak különálló honlapokon lehetett böngészni, hogyan alakult a szavazatok száma az egyes szavazókörökben. Ezeket az oldalakat adatbányászok segítségével feldolgoztuk, így jöhettek létre a G7.hu adatelemzései az elmúlt két hétben a választási eredményekről.
Persze nem csak mi bosszankodtunk ezen, hanem a magyar adatbányász és elemző közösségből többen is megtették, amit megkövetel ez a szakma, és elemezhető struktúrába rendezték az adatokat (külön Tumblr is indult Választási Hackathon néven).
Az adatnyilvánosság rendkívül fontos, főleg azóta, hogy már a hétköznapi számítógépek is alkalmasak viszonylag nagy adattömeg – például a szavazókörönkénti választási eredmények – feldolgozására, így egyre többen kapcsolódhatnak be érdeklődő és felelős állampolgárként a demokrácia ellenőrzésébe. Ez pedig minden, a demokratikus rend iránt elkötelezett egyén és szervezet számára előnyös.
Mégis, úgy látjuk, hogy vannak állami szervezetek, amelyek nem veszi figyelembe ezeket az igényeket, most például a Nemzeti Választási Iroda esetében ütközött ki ez az alapvető hiányosság.
A G7 szerkesztősége is elkötelezett a közadatok nyitott kezelése mellett, és bár nem tudományos lapként működünk, fontosnak tartjuk az igazi tudományos elemzéseknek azt az értékét is, hogy pontosan visszakövethetőek, reprodukálhatóak és így érdemben megvitathatóak.
Ennek érdekében megnyitottuk GitHub fiókunkat, ahova elsőként a Fidesz listás eredményét, illetve a társadalmi-gazdasági mutatók közötti összefüggéseket együttesen elemző cikkünkhöz felhasznált adatokat és az elemzést R-ben (ez egy nyílt forráskódú statisztikai szoftver) végrehajtó parancsfájlt tesszük fel.
Szándékaink szerint a későbbiekben még több adatbázist és elemzési háttéranyagot fogunk itt megosztani.
Élet
Fontos