Podaci o koronavirusu u Hrvatskoj moraju biti u strojno čitljivom formatu!

Podaci o koronavirusu u Hrvatskoj moraju biti u strojno čitljivom formatu!

Otvaranje podataka javnosti u strojno čitljivom obliku znači otvaranje drugim perspektivama i stručnim umovima koji mogu doprinijeti razumijevanju situacije. No, umjesto da jednostavno ubacuju retke iz Excel tablice, podatke o COVID-19 neki stručnjaci još moraju pratiti prepisivanjem tekstualnih zapisa sa službenih javljanja.

Prije skoro mjesec dana Vlada je vrlo brzo reagirala na zahtjeve javnosti i objavila službenu stranicu Koronavirus.hr koja je postala centralno mjesto za informacije vezane uz COVID-19. Na njoj danas možemo naći različite korisne informacije o mjerama predostrožnosti, simptomima zaraze i drugim pojedinostima oko ponašanja u vrijeme pandemije.

Sve je preglednije i dostupnije, istina, ali samo za prosječnog građanina. Nažalost, ni za njega nema dovoljno informacija. Praćenjem poveznica na svaku županiju, ne otvara nam se stranica na kojoj vidimo lokalno relevantne informacije o raspodjeli broja zaraženi, izliječenih i umrlih, već samo par natuknica o mjerama koje su provedene. Vjerojatno je i zato nastala dalmacija.koronavirus.hr gdje se mogu pratiti konkretne brojke na županijskoj razini.

Nažalost, stručnjacima koji žele izvući što više informacija iz sirovih podataka kako bi ih prikazali, povezali i analizirali na različite načine – podaci koje Vlada trenutno objavljuje putem službenih javljanja i stranice koronavirus.hr još su manje korisni. I to iz jednog razloga: nisu strojno čitljivi.

“Čekaj samo da zapišem brojke s konferencije…”

Imamo niz stručnjaka koji znaju uobličiti i prezentirati podatke, no njihovi napori uistinu postanu napori kad to znači da u xy sati svakog dana neki od njih, žele li napraviti kakvu takvu analizu ili vizualizaciju, moraju sjesti ispred TV-a ili upaliti online prijenos kako bi upratili današnje COVID-19 brojke.

Jedan od tih stručnjaka je i Vibor Cipan, CEO tvrtke Point Jupiter, koji je svojevremeno radio i na vizualizaciji rezultata izbora za predsjednika Republike Hrvatske 2014. godine. Nakon što je jučer pretipkao podatke s javljanja za vizualizaciju podataka o koronavirusu koji objavljuje na svojoj stranici, istaknuo mi je u čemu je problem:

Kako ih i sam pozorno pratim i prikupljam, iz prve ruke vidim koliko je taj proces težak. Podaci se objavljuju na webu jednom dnevno, ponekad i sa značajnim odmakom tako da u pravilu slušam i pratim tiskovne konferencije Stožera kako bih pretipkao iznesene podatke u GitHub repozitorij, a potom ih i objavio te vizualizirao na webu i na Twitteru.

Iako Vlada razmjerno kvalitetno provodi epidemiološke mjere i pazi na zdravlje stanovnika, a poboljšana je i komunikacija s javnošću preko službenog weba, ističe Vibor kako su svi oni, koji pokušavaju raditi neku napredniju analitiku ili vizualizacije podataka o oboljelima, oporavljenima, slučajevima na respiratoru i preminulima, suočeni s nedostatkom objave jasnih, ujednačenih i strojno čitljivih podataka. Stručnjacima poput Vibora trebaju transparentni dnevni podaci o nacionalnim i županijskim slučajevima, a u obliku koji im je koristan za daljnju obradu (.xls ili .csv datoteke).

Što se može s otvorenim podacima?

Sigurno više nego što se može bez otvorenih. Prisjetimo se slične situacije prošle godine. U jeku turističke sezone, ministar turizma Gari Cappelli objasnio je kako su odlučili eVisitor izvještaje objavljivati tri puta godišnje umjesto mjesečno. Osim toga što objava takvih podataka ne da bi trebala biti mjesečna ili tromjesečna – već u realnom vremenu, dodatan problem je predstavljala i činjenica da se sami izvještaji objavljuju u PDF-u – što nije koristilo nikome.

O važnosti dijeljenja podataka od javnog interesa u strojno obradivom obliku, analitičar Marko Rakar i tada je komentirao za Netokraciju, no u vrijeme pandemije ta važnost postaje skoro pa nužnost:

Moj opći stav je kako sve podatke od javnog interesa treba dijeliti i to u strojno obradivom obliku. Smatram nadalje kako je ova situacija s koronavirusom školski primjer situacije kada bi se podaci morali beskompromisno dijeliti sa stručnom javnošću, a to znači s matematičarima, statističarima, ljudima koji su stručnjaci u obradi i vizualizaciji podataka i svima drugima kojima su takvi podaci potrebni ili koji mogu imati od takvih podataka koristi. Neosporno je da talentiranih i visoko motiviranih ljudi ima daleko više izvan koronavirus.hr nego unutar njega.

Ugledajmo se na druge

Primjerice, Južnu Koreju. Zemlju koja je bilježila ogroman rast zaraženih sve do trenutka kada su odlučili testirati sve u državi te su praktički skoro izravnali krivulju rasta zaraze. Uz niz drugih mjera to im je pomoglo da dođu do velikog broja relevantnih podataka, a koje su potom otvorili na javno korištenje. Skup podataka za čitavu državu do najsitnijih detalja objavljen je na GitHubu, a na kojem već sada ima commitova s analizama različitih aspekata pandemije pa tako i od koga najčešće dolazi zaraza!

Na sličan način na svjetskoj razini podatke prikuplja i objavljuje Sveučilište Johns Hopkins, koje koristi i hrvatski GDi u svojoj vizualizaciji COVID-19 podataka. Ali ne moramo gledati toliko daleko ni globalno. Susjedna Slovenija je također objavila strojno čitljive podatke o broju izliječenih osoba, otpuštenih iz bolnice, onih na intenzivnoj, testiranih, zaraženih i umrlih. Tako i Vibor s pohvalama spominje na slovenskim podacima baziran projekt Sledilnik koji ima vrlo granulirane i precizne podatke do razine pojedinog grada ili općine.

Dovoljan je jedan red u strojno čitljivom formatu… Slovenija je svoje podatke objavila u .csv, .ods i .xslx datotekama, trenutno ih objavljuju dnevno, a ne zbirno.

Osim toga, spriječit će se i pogreške.

Situacija koje utječu na praćenje ima svakakvih, tako se neki dan više desetaka osoba iz Doma za starije i nemoćne iz Vukovarske ulice u Splitu, koji je postao žarište širenja virusa, premjestilo u bolnice u Makarskoj, ali i Zagrebu.

A kako mi priča Vibor, posebno je problematično to što su se i podaci o oboljelima na razini županija mijenjali:

Imali smo objedinjene podatke za Zagreb i Zagrebačku županiju, potom su bili odvojeni, a onda je još došlo i do promjene metodologije bilježenja slučajeva (mjesto testiranja vs mjesto prebivališta). Naravno, u cijelom tom procesu ručnog “hvatanja” podataka, mogu se potkrasti pogreške.

Nema opravdanja za netransparentnost

Treba pozdraviti napore vlade i nedavno predstavljanje digitalnog pomoćnika Andrije, dodaje Vibor, ali treba ih i potaknuti na veće otvaranje izvora podataka kako bi tako omogućili cijelom ekosustavu ljudi koji se bave analitikom i vizualizacijama (pa i novinarima!) veće mogućnosti rada, a ujedno bi time dodatno povećali povjerenje građana i jačali otvorenost kao jednu od demokratskih vrijednosti.

Postoji niz istraživanja koji ukazuju na dodanu vrijednost koja se u ekonomiji postiže otvaranjem podataka kojima raspolaže vlada i druga tijela uprave. No sve i ako ekonomska motivacija nije sama po sebi jedini argument, povećanjem raspoloživosti podataka povećao bi se i stupanj povjerenja građana u institucije – u ovom slučaju u sam Stožer, Vladu i Ministarstvo zdravlja. Posebno je ovo interesantno imajući na umu kako je Vlada prije nekoliko godina otvorila svoj portal otvorenih podataka, međutim isti nije ažuriran od 2017. godine.

Marko Rakar dodaje kako je neodgovorno, nemarno i općenito podcjenjujuće da unatoč pozivima kojih je u proteklih mjesec dana bilo više nego dovoljno, nadležni iza Koronavirus.hr nisu pronašli vremena ili energije da te podatke podijele sa svima:

Vlada se i u ovoj situaciji, kao i u mnogim drugima, ponaša poput autokratskog gatekeepera i to je, osobito u ovakvim vremenima, osobito neodgovorno prema stručnoj publici koju ti podaci zanimaju i kojima ti podaci nasušno trebaju.

A čak i da ti podaci nisu na nikoji način sustavno do sada praćeni, tim gore – ne samo da tako zakidaju vanjske stručnjake, već i cijeli sustav javnih institucija koji se ne može u 2020. uskladiti voditi uređenu digitalnu evidenciju.

Sledilnik je projekt nekoliko desetaka slovenskih stručnjaka, a koji su sebi na trud uzeli dodatno srediti prikupljene podatke. No, ni toga ne bi bilo da nije pristigao barem onaj jedan red iz njihovog Ministarstva…

O ovim pitanjima dobili smo kratko očitovanje Hrvatskog zavoda za javno zdravstvo, čija mi je predstavnica potvrdila da postoji evidencija u strojno čitljivom obliku, ali da otvaranje tih podataka javnosti ovisi o odluci nadležnog Stožera za civilnu zaštitu. Stoga smo Stožeru, voditeljima Koronavirus.hr stranice te Ministarstvu uprave poslali upit kada bi mogli očekivati otvaranje podataka, no odgovore još čekamo.

Komentari

  1. stalni čitatelj netokracije

    stalni čitatelj netokracije

    16. 04. 2020. u 1:17 am Odgovori

    Zašto stalno pozivanje za komentar ” stručnog komunikatora IT stručnjaka” Marka Rakara… sigurno imamo relevantnije i neovisnije (nisu politički i stranački aktivni poput njega) stručnjake u IT području koji ne zarađuju novac isključivo kroz jednostavne nabave raznih ministarstava kada je njihova stranka na vlasti… (srpske novosti su svojedobno nakon što je bio u Josipovićevoj kampanji za predsjenika napravile jedno pravo novinarsko istraživanje o njemu, preporučam za pročitati)…. ili barem stavite SDPov analitičar da čitatelj dobije kontekst njegovog komentara.

  2. Karai Puku

    Karai Puku

    22. 04. 2020. u 3:28 pm Odgovori

    dobro je da postoje volonteri, ljudi koji u ovom teškom trenutku za zemlju imaju volje energije i znanja pomoći konstruktivnom kritikom. Što bismo bez njih? Ne bismo znali prepoznati epidemiju, razlikovati eksponencijalni od linearnog rasta, nabaviti tisuće kompleta zaštitne opreme, izolirati virus, organizirati liječenje i testiranje, odgovoriti na stotine tisuća poziva epidemiologu.
    Bez šale, i bez zle namjere, svi koji su spremni biti epidemiolozi iz naslonjača, puno bi pomogli hrvatskom društvu, građanima kad bi se, u trenutcima kad nisu zauzeti visokostručnim poslom konstruktivne kritike, uključili u konkretni posao, na primjer volontirali na dežurnom telefonu epidemiologa i preuzeli barem dio posla
    To su vrhunski inteligenti ljudi, koji znaju engleski, prate mrežne sadržaje, o COVID virusu znaju katkad i više od infektologa, o borbi protiv pandemije više od epidemiologa, znaju podatke analizirati, vizualizirati ali aktualna vlast ne prihvaća njihovu pomoć
    Dođite, nazovite, pitajte. Ima puno načina na koji bi pametni ljudi dobre volje mogli pomoći ako hoće

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Startupi i poslovanje

Saša Fišter platformom Sliceer planira dobiti gem, set i meč digitalizacije teniskih klubova

Aplikacija za digitaliziranje teniskih klubova i gemifikaciju igranja tenisa Sliceer danas ima više od 1400 aktivnih korisnika koji putem nje organiziranju mečeve i turnire.

Tehnologija

Kako otvoriti webshop? Važan korak je odabir platforme – što nudi WooCommerce?

Došla je pandemija i odjednom vam je pokretanje web trgovine postalo glavni prioritet? Važna odluka koja vas čeka je odabir platforme na temelju koje ćete napraviti svoje eCommerce carstvo. U moru alata čudnih imena, jedan iskače više od drugih - WooCommerce.

Intervju

Dostava piva nije vožnja po gradu uz GoogleMaps, znaju to Medvedgrad i OptimoRoute

Nakon osigurane investicije od gotovo sedam milijuna dolara, OptimoRoute planira širenje ureda u Zagrebu kako bi malim tvrtkama približili logističko planiranje slično onome koje imaju velike tvrtke.

Što ste propustili

Startupi i poslovanje

Wolt, Infobip i KEKSPay otkrili što ih je kaos oko COVID-19 naučio o CX-u

S obzirom na nove okolnosti rada i života koje je donijela pandemija, osluškivanje tržišta brendovima je postalo bitnije nego ikad. Oni koji su pomno pratili promjene snašli su se nešto bolje, ali nitko nije bio imun na izazove. Uz domaće i strane stručnjake na Digitalnom doručku prošli smo najvažnije aspekte korisničkog iskustva u neizvjesnim vremenima ne bi li spremnije dočekali mjesece pred nama.

Društvene mreže

Što morate znati o Trumpovom bijesu prema Twitteru – i posljedicama za Facebook i Google, vas?

Očekivano, Donaldu Trumpu se potez Twittera, koji je označio njegove objave spornima, nije nimalo svidio pa je donio uredbu kojom želi dodatno regulirati društvene mreže, učinivši ih direktno odgovornima za ono što njihovi korisnici objavljuju.

Startupi i poslovanje

Ivan Burazin: Shift uživo u rujnu, a do tada organiziramo online predavanja!

Shift se drži i dalje, a ovogodišnje izdanje neće biti prebačeno online, već će se u rujnu održati uživo!

Intervju

Miljenko Graovac novi je direktor digitalnih proizvoda u HT-u: Introspektiva je ključ inovacija!

Privukla me vizija kompanije: digitalizacija i povezivanje privatnih osoba, tvrtki i društva s prilikama koje ona pruža, kaže novi šef digitalnih proizvoda u Hrvatskom Telekomu s kojim smo imali priliku razgovarati o karijeri te implementaciji digitalnih proizvoda i rješenja u velikim tvrtkama.

Najava

Što vas čeka kao programere nakon faksa – u doba krize? Saznaj na Digitalna karijera meetupu!

Pred nadolazeću krizu preostalih par ispita do kraja ili diploma u ruci nude malo nade za mlade, ali i to prijelazno razdoblje nosi neke prednosti i prilike, čak i u neizvjesnim vremenima. Kako razviti željenu karijeru na pomolu ekonomske krize, otkrivamo uz digitalne stručnjake na novom meetupu Digitalne karijere.

Startupi i poslovanje

Više Instagram nego intranet: Jenz je aplikacija koju vaš tim nije znao da treba!

Umjesto emailova, Facebook eventova, Google kalendara, anketa, Instagram profila, Slack #general i #win kanala, razmjene kontakata - možda je vrijeme da se sve složi u jedno? Hrvatski Q napravio je upravo to s aplikacijom Jenz.