Otvaranje podataka javnosti u strojno čitljivom obliku znači otvaranje drugim perspektivama i stručnim umovima koji mogu doprinijeti razumijevanju situacije. No, umjesto da jednostavno ubacuju retke iz Excel tablice, podatke o COVID-19 neki stručnjaci još moraju pratiti prepisivanjem tekstualnih zapisa sa službenih javljanja.
Prije skoro mjesec dana Vlada je vrlo brzo reagirala na zahtjeve javnosti i objavila službenu stranicu Koronavirus.hr koja je postala centralno mjesto za informacije vezane uz COVID-19. Na njoj danas možemo naći različite korisne informacije o mjerama predostrožnosti, simptomima zaraze i drugim pojedinostima oko ponašanja u vrijeme pandemije.
Sve je preglednije i dostupnije, istina, ali samo za prosječnog građanina. Nažalost, ni za njega nema dovoljno informacija. Praćenjem poveznica na svaku županiju, ne otvara nam se stranica na kojoj vidimo lokalno relevantne informacije o raspodjeli broja zaraženi, izliječenih i umrlih, već samo par natuknica o mjerama koje su provedene. Vjerojatno je i zato nastala dalmacija.koronavirus.hr gdje se mogu pratiti konkretne brojke na županijskoj razini.
Nažalost, stručnjacima koji žele izvući što više informacija iz sirovih podataka kako bi ih prikazali, povezali i analizirali na različite načine – podaci koje Vlada trenutno objavljuje putem službenih javljanja i stranice koronavirus.hr još su manje korisni. I to iz jednog razloga: nisu strojno čitljivi.
“Čekaj samo da zapišem brojke s konferencije…”
Imamo niz stručnjaka koji znaju uobličiti i prezentirati podatke, no njihovi napori uistinu postanu napori kad to znači da u xy sati svakog dana neki od njih, žele li napraviti kakvu takvu analizu ili vizualizaciju, moraju sjesti ispred TV-a ili upaliti online prijenos kako bi upratili današnje COVID-19 brojke.
Jedan od tih stručnjaka je i Vibor Cipan, CEO tvrtke Point Jupiter, koji je svojevremeno radio i na vizualizaciji rezultata izbora za predsjednika Republike Hrvatske 2014. godine. Nakon što je jučer pretipkao podatke s javljanja za vizualizaciju podataka o koronavirusu koji objavljuje na svojoj stranici, istaknuo mi je u čemu je problem:
Kako ih i sam pozorno pratim i prikupljam, iz prve ruke vidim koliko je taj proces težak. Podaci se objavljuju na webu jednom dnevno, ponekad i sa značajnim odmakom tako da u pravilu slušam i pratim tiskovne konferencije Stožera kako bih pretipkao iznesene podatke u GitHub repozitorij, a potom ih i objavio te vizualizirao na webu i na Twitteru.
Iako Vlada razmjerno kvalitetno provodi epidemiološke mjere i pazi na zdravlje stanovnika, a poboljšana je i komunikacija s javnošću preko službenog weba, ističe Vibor kako su svi oni, koji pokušavaju raditi neku napredniju analitiku ili vizualizacije podataka o oboljelima, oporavljenima, slučajevima na respiratoru i preminulima, suočeni s nedostatkom objave jasnih, ujednačenih i strojno čitljivih podataka. Stručnjacima poput Vibora trebaju transparentni dnevni podaci o nacionalnim i županijskim slučajevima, a u obliku koji im je koristan za daljnju obradu (.xls ili .csv datoteke).
Jedan primjer koliko je teško doći do strojno čitljiv i sustavnih podataka za #COVID19 i #koronavirus u #Hrvatska. Ovdje su podaci prikupljeni preslušavanjem tiskovnih konferencija Stožera. Ne dobijemo svaki dan sve informacije i stoga je jako teško raditi kvalitetnije analize. pic.twitter.com/rSuav0chUF
— viborc.com (@ViborcCom) April 14, 2020
Što se može s otvorenim podacima?

Sigurno više nego što se može bez otvorenih. Prisjetimo se slične situacije prošle godine. U jeku turističke sezone, ministar turizma Gari Cappelli objasnio je kako su odlučili eVisitor izvještaje objavljivati tri puta godišnje umjesto mjesečno. Osim toga što objava takvih podataka ne da bi trebala biti mjesečna ili tromjesečna – već u realnom vremenu, dodatan problem je predstavljala i činjenica da se sami izvještaji objavljuju u PDF-u – što nije koristilo nikome.
O važnosti dijeljenja podataka od javnog interesa u strojno obradivom obliku, analitičar Marko Rakar i tada je komentirao za Netokraciju, no u vrijeme pandemije ta važnost postaje skoro pa nužnost:
Moj opći stav je kako sve podatke od javnog interesa treba dijeliti i to u strojno obradivom obliku. Smatram nadalje kako je ova situacija s koronavirusom školski primjer situacije kada bi se podaci morali beskompromisno dijeliti sa stručnom javnošću, a to znači s matematičarima, statističarima, ljudima koji su stručnjaci u obradi i vizualizaciji podataka i svima drugima kojima su takvi podaci potrebni ili koji mogu imati od takvih podataka koristi. Neosporno je da talentiranih i visoko motiviranih ljudi ima daleko više izvan koronavirus.hr nego unutar njega.
Ugledajmo se na druge
Primjerice, Južnu Koreju. Zemlju koja je bilježila ogroman rast zaraženih sve do trenutka kada su odlučili testirati sve u državi te su praktički skoro izravnali krivulju rasta zaraze. Uz niz drugih mjera to im je pomoglo da dođu do velikog broja relevantnih podataka, a koje su potom otvorili na javno korištenje. Skup podataka za čitavu državu do najsitnijih detalja objavljen je na GitHubu, a na kojem već sada ima commitova s analizama različitih aspekata pandemije pa tako i od koga najčešće dolazi zaraza!
Na sličan način na svjetskoj razini podatke prikuplja i objavljuje Sveučilište Johns Hopkins, koje koristi i hrvatski GDi u svojoj vizualizaciji COVID-19 podataka. Ali ne moramo gledati toliko daleko ni globalno. Susjedna Slovenija je također objavila strojno čitljive podatke o broju izliječenih osoba, otpuštenih iz bolnice, onih na intenzivnoj, testiranih, zaraženih i umrlih. Tako i Vibor s pohvalama spominje na slovenskim podacima baziran projekt Sledilnik koji ima vrlo granulirane i precizne podatke do razine pojedinog grada ili općine.

Osim toga, spriječit će se i pogreške.
Situacija koje utječu na praćenje ima svakakvih, tako se neki dan više desetaka osoba iz Doma za starije i nemoćne iz Vukovarske ulice u Splitu, koji je postao žarište širenja virusa, premjestilo u bolnice u Makarskoj, ali i Zagrebu.
A kako mi priča Vibor, posebno je problematično to što su se i podaci o oboljelima na razini županija mijenjali:
Imali smo objedinjene podatke za Zagreb i Zagrebačku županiju, potom su bili odvojeni, a onda je još došlo i do promjene metodologije bilježenja slučajeva (mjesto testiranja vs mjesto prebivališta). Naravno, u cijelom tom procesu ručnog “hvatanja” podataka, mogu se potkrasti pogreške.
Nema opravdanja za netransparentnost
Treba pozdraviti napore vlade i nedavno predstavljanje digitalnog pomoćnika Andrije, dodaje Vibor, ali treba ih i potaknuti na veće otvaranje izvora podataka kako bi tako omogućili cijelom ekosustavu ljudi koji se bave analitikom i vizualizacijama (pa i novinarima!) veće mogućnosti rada, a ujedno bi time dodatno povećali povjerenje građana i jačali otvorenost kao jednu od demokratskih vrijednosti.
Postoji niz istraživanja koji ukazuju na dodanu vrijednost koja se u ekonomiji postiže otvaranjem podataka kojima raspolaže vlada i druga tijela uprave. No sve i ako ekonomska motivacija nije sama po sebi jedini argument, povećanjem raspoloživosti podataka povećao bi se i stupanj povjerenja građana u institucije – u ovom slučaju u sam Stožer, Vladu i Ministarstvo zdravlja. Posebno je ovo interesantno imajući na umu kako je Vlada prije nekoliko godina otvorila svoj portal otvorenih podataka, međutim isti nije ažuriran od 2017. godine.
Marko Rakar dodaje kako je neodgovorno, nemarno i općenito podcjenjujuće da unatoč pozivima kojih je u proteklih mjesec dana bilo više nego dovoljno, nadležni iza Koronavirus.hr nisu pronašli vremena ili energije da te podatke podijele sa svima:
Vlada se i u ovoj situaciji, kao i u mnogim drugima, ponaša poput autokratskog gatekeepera i to je, osobito u ovakvim vremenima, osobito neodgovorno prema stručnoj publici koju ti podaci zanimaju i kojima ti podaci nasušno trebaju.
A čak i da ti podaci nisu na nikoji način sustavno do sada praćeni, tim gore – ne samo da tako zakidaju vanjske stručnjake, već i cijeli sustav javnih institucija koji se ne može u 2020. uskladiti voditi uređenu digitalnu evidenciju.

O ovim pitanjima dobili smo kratko očitovanje Hrvatskog zavoda za javno zdravstvo, čija mi je predstavnica potvrdila da postoji evidencija u strojno čitljivom obliku, ali da otvaranje tih podataka javnosti ovisi o odluci nadležnog Stožera za civilnu zaštitu. Stoga smo Stožeru, voditeljima Koronavirus.hr stranice te Ministarstvu uprave poslali upit kada bi mogli očekivati otvaranje podataka, no odgovore još čekamo.
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.
Pravila ponašanja
Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:
Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.
Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.
Komentari
Srđan Jerković
15. 04. 2020. u 5:35 pm
Odličan članak i nadasve koristan…samo oni kojima je namijenjen ga trebaju i shvatiti, a to ili ne žele (donekle shvatljivo ) ili ne mogu ( to je onda katastrofa).
stalni čitatelj netokracije
16. 04. 2020. u 1:17 am
Zašto stalno pozivanje za komentar ” stručnog komunikatora IT stručnjaka” Marka Rakara… sigurno imamo relevantnije i neovisnije (nisu politički i stranački aktivni poput njega) stručnjake u IT području koji ne zarađuju novac isključivo kroz jednostavne nabave raznih ministarstava kada je njihova stranka na vlasti… (srpske novosti su svojedobno nakon što je bio u Josipovićevoj kampanji za predsjenika napravile jedno pravo novinarsko istraživanje o njemu, preporučam za pročitati)…. ili barem stavite SDPov analitičar da čitatelj dobije kontekst njegovog komentara.
Karai Puku
22. 04. 2020. u 3:28 pm
dobro je da postoje volonteri, ljudi koji u ovom teškom trenutku za zemlju imaju volje energije i znanja pomoći konstruktivnom kritikom. Što bismo bez njih? Ne bismo znali prepoznati epidemiju, razlikovati eksponencijalni od linearnog rasta, nabaviti tisuće kompleta zaštitne opreme, izolirati virus, organizirati liječenje i testiranje, odgovoriti na stotine tisuća poziva epidemiologu.
Bez šale, i bez zle namjere, svi koji su spremni biti epidemiolozi iz naslonjača, puno bi pomogli hrvatskom društvu, građanima kad bi se, u trenutcima kad nisu zauzeti visokostručnim poslom konstruktivne kritike, uključili u konkretni posao, na primjer volontirali na dežurnom telefonu epidemiologa i preuzeli barem dio posla
To su vrhunski inteligenti ljudi, koji znaju engleski, prate mrežne sadržaje, o COVID virusu znaju katkad i više od infektologa, o borbi protiv pandemije više od epidemiologa, znaju podatke analizirati, vizualizirati ali aktualna vlast ne prihvaća njihovu pomoć
Dođite, nazovite, pitajte. Ima puno načina na koji bi pametni ljudi dobre volje mogli pomoći ako hoće
Jura Martin
04. 05. 2020. u 10:44 am
https://koronavirus.hr/otvoreni-strojno-citljivi-podaci/526
Možda se ipak nešto pomaklo…