Podaci o koronavirusu u Hrvatskoj moraju biti u strojno čitljivom formatu!

Podaci o koronavirusu u Hrvatskoj moraju biti u strojno čitljivom formatu!

Otvaranje podataka javnosti u strojno čitljivom obliku znači otvaranje drugim perspektivama i stručnim umovima koji mogu doprinijeti razumijevanju situacije. No, umjesto da jednostavno ubacuju retke iz Excel tablice, podatke o COVID-19 neki stručnjaci još moraju pratiti prepisivanjem tekstualnih zapisa sa službenih javljanja.

Prije skoro mjesec dana Vlada je vrlo brzo reagirala na zahtjeve javnosti i objavila službenu stranicu Koronavirus.hr koja je postala centralno mjesto za informacije vezane uz COVID-19. Na njoj danas možemo naći različite korisne informacije o mjerama predostrožnosti, simptomima zaraze i drugim pojedinostima oko ponašanja u vrijeme pandemije.

Sve je preglednije i dostupnije, istina, ali samo za prosječnog građanina. Nažalost, ni za njega nema dovoljno informacija. Praćenjem poveznica na svaku županiju, ne otvara nam se stranica na kojoj vidimo lokalno relevantne informacije o raspodjeli broja zaraženi, izliječenih i umrlih, već samo par natuknica o mjerama koje su provedene. Vjerojatno je i zato nastala dalmacija.koronavirus.hr gdje se mogu pratiti konkretne brojke na županijskoj razini.

Nažalost, stručnjacima koji žele izvući što više informacija iz sirovih podataka kako bi ih prikazali, povezali i analizirali na različite načine – podaci koje Vlada trenutno objavljuje putem službenih javljanja i stranice koronavirus.hr još su manje korisni. I to iz jednog razloga: nisu strojno čitljivi.

“Čekaj samo da zapišem brojke s konferencije…”

Imamo niz stručnjaka koji znaju uobličiti i prezentirati podatke, no njihovi napori uistinu postanu napori kad to znači da u xy sati svakog dana neki od njih, žele li napraviti kakvu takvu analizu ili vizualizaciju, moraju sjesti ispred TV-a ili upaliti online prijenos kako bi upratili današnje COVID-19 brojke.

Jedan od tih stručnjaka je i Vibor Cipan, CEO tvrtke Point Jupiter, koji je svojevremeno radio i na vizualizaciji rezultata izbora za predsjednika Republike Hrvatske 2014. godine. Nakon što je jučer pretipkao podatke s javljanja za vizualizaciju podataka o koronavirusu koji objavljuje na svojoj stranici, istaknuo mi je u čemu je problem:

Kako ih i sam pozorno pratim i prikupljam, iz prve ruke vidim koliko je taj proces težak. Podaci se objavljuju na webu jednom dnevno, ponekad i sa značajnim odmakom tako da u pravilu slušam i pratim tiskovne konferencije Stožera kako bih pretipkao iznesene podatke u GitHub repozitorij, a potom ih i objavio te vizualizirao na webu i na Twitteru.

Iako Vlada razmjerno kvalitetno provodi epidemiološke mjere i pazi na zdravlje stanovnika, a poboljšana je i komunikacija s javnošću preko službenog weba, ističe Vibor kako su svi oni, koji pokušavaju raditi neku napredniju analitiku ili vizualizacije podataka o oboljelima, oporavljenima, slučajevima na respiratoru i preminulima, suočeni s nedostatkom objave jasnih, ujednačenih i strojno čitljivih podataka. Stručnjacima poput Vibora trebaju transparentni dnevni podaci o nacionalnim i županijskim slučajevima, a u obliku koji im je koristan za daljnju obradu (.xls ili .csv datoteke).

Što se može s otvorenim podacima?

Sigurno više nego što se može bez otvorenih. Prisjetimo se slične situacije prošle godine. U jeku turističke sezone, ministar turizma Gari Cappelli objasnio je kako su odlučili eVisitor izvještaje objavljivati tri puta godišnje umjesto mjesečno. Osim toga što objava takvih podataka ne da bi trebala biti mjesečna ili tromjesečna – već u realnom vremenu, dodatan problem je predstavljala i činjenica da se sami izvještaji objavljuju u PDF-u – što nije koristilo nikome.

O važnosti dijeljenja podataka od javnog interesa u strojno obradivom obliku, analitičar Marko Rakar i tada je komentirao za Netokraciju, no u vrijeme pandemije ta važnost postaje skoro pa nužnost:

Moj opći stav je kako sve podatke od javnog interesa treba dijeliti i to u strojno obradivom obliku. Smatram nadalje kako je ova situacija s koronavirusom školski primjer situacije kada bi se podaci morali beskompromisno dijeliti sa stručnom javnošću, a to znači s matematičarima, statističarima, ljudima koji su stručnjaci u obradi i vizualizaciji podataka i svima drugima kojima su takvi podaci potrebni ili koji mogu imati od takvih podataka koristi. Neosporno je da talentiranih i visoko motiviranih ljudi ima daleko više izvan koronavirus.hr nego unutar njega.

Ugledajmo se na druge

Primjerice, Južnu Koreju. Zemlju koja je bilježila ogroman rast zaraženih sve do trenutka kada su odlučili testirati sve u državi te su praktički skoro izravnali krivulju rasta zaraze. Uz niz drugih mjera to im je pomoglo da dođu do velikog broja relevantnih podataka, a koje su potom otvorili na javno korištenje. Skup podataka za čitavu državu do najsitnijih detalja objavljen je na GitHubu, a na kojem već sada ima commitova s analizama različitih aspekata pandemije pa tako i od koga najčešće dolazi zaraza!

Na sličan način na svjetskoj razini podatke prikuplja i objavljuje Sveučilište Johns Hopkins, koje koristi i hrvatski GDi u svojoj vizualizaciji COVID-19 podataka. Ali ne moramo gledati toliko daleko ni globalno. Susjedna Slovenija je također objavila strojno čitljive podatke o broju izliječenih osoba, otpuštenih iz bolnice, onih na intenzivnoj, testiranih, zaraženih i umrlih. Tako i Vibor s pohvalama spominje na slovenskim podacima baziran projekt Sledilnik koji ima vrlo granulirane i precizne podatke do razine pojedinog grada ili općine.

Dovoljan je jedan red u strojno čitljivom formatu… Slovenija je svoje podatke objavila u .csv, .ods i .xslx datotekama, trenutno ih objavljuju dnevno, a ne zbirno.

Osim toga, spriječit će se i pogreške.

Situacija koje utječu na praćenje ima svakakvih, tako se neki dan više desetaka osoba iz Doma za starije i nemoćne iz Vukovarske ulice u Splitu, koji je postao žarište širenja virusa, premjestilo u bolnice u Makarskoj, ali i Zagrebu.

A kako mi priča Vibor, posebno je problematično to što su se i podaci o oboljelima na razini županija mijenjali:

Imali smo objedinjene podatke za Zagreb i Zagrebačku županiju, potom su bili odvojeni, a onda je još došlo i do promjene metodologije bilježenja slučajeva (mjesto testiranja vs mjesto prebivališta). Naravno, u cijelom tom procesu ručnog “hvatanja” podataka, mogu se potkrasti pogreške.

Nema opravdanja za netransparentnost

Treba pozdraviti napore vlade i nedavno predstavljanje digitalnog pomoćnika Andrije, dodaje Vibor, ali treba ih i potaknuti na veće otvaranje izvora podataka kako bi tako omogućili cijelom ekosustavu ljudi koji se bave analitikom i vizualizacijama (pa i novinarima!) veće mogućnosti rada, a ujedno bi time dodatno povećali povjerenje građana i jačali otvorenost kao jednu od demokratskih vrijednosti.

Postoji niz istraživanja koji ukazuju na dodanu vrijednost koja se u ekonomiji postiže otvaranjem podataka kojima raspolaže vlada i druga tijela uprave. No sve i ako ekonomska motivacija nije sama po sebi jedini argument, povećanjem raspoloživosti podataka povećao bi se i stupanj povjerenja građana u institucije – u ovom slučaju u sam Stožer, Vladu i Ministarstvo zdravlja. Posebno je ovo interesantno imajući na umu kako je Vlada prije nekoliko godina otvorila svoj portal otvorenih podataka, međutim isti nije ažuriran od 2017. godine.

Marko Rakar dodaje kako je neodgovorno, nemarno i općenito podcjenjujuće da unatoč pozivima kojih je u proteklih mjesec dana bilo više nego dovoljno, nadležni iza Koronavirus.hr nisu pronašli vremena ili energije da te podatke podijele sa svima:

Vlada se i u ovoj situaciji, kao i u mnogim drugima, ponaša poput autokratskog gatekeepera i to je, osobito u ovakvim vremenima, osobito neodgovorno prema stručnoj publici koju ti podaci zanimaju i kojima ti podaci nasušno trebaju.

A čak i da ti podaci nisu na nikoji način sustavno do sada praćeni, tim gore – ne samo da tako zakidaju vanjske stručnjake, već i cijeli sustav javnih institucija koji se ne može u 2020. uskladiti voditi uređenu digitalnu evidenciju.

Sledilnik je projekt nekoliko desetaka slovenskih stručnjaka, a koji su sebi na trud uzeli dodatno srediti prikupljene podatke. No, ni toga ne bi bilo da nije pristigao barem onaj jedan red iz njihovog Ministarstva…

O ovim pitanjima dobili smo kratko očitovanje Hrvatskog zavoda za javno zdravstvo, čija mi je predstavnica potvrdila da postoji evidencija u strojno čitljivom obliku, ali da otvaranje tih podataka javnosti ovisi o odluci nadležnog Stožera za civilnu zaštitu. Stoga smo Stožeru, voditeljima Koronavirus.hr stranice te Ministarstvu uprave poslali upit kada bi mogli očekivati otvaranje podataka, no odgovore još čekamo.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome)
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime (Hrvoje Lončar) ili barem ime i inicijala (Hrvoje L.) te pravu email adresu. Kako koristimo podatke koje tamo ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Komentari

  1. stalni čitatelj netokracije

    stalni čitatelj netokracije

    16. 04. 2020. u 1:17 am Odgovori

    Zašto stalno pozivanje za komentar ” stručnog komunikatora IT stručnjaka” Marka Rakara… sigurno imamo relevantnije i neovisnije (nisu politički i stranački aktivni poput njega) stručnjake u IT području koji ne zarađuju novac isključivo kroz jednostavne nabave raznih ministarstava kada je njihova stranka na vlasti… (srpske novosti su svojedobno nakon što je bio u Josipovićevoj kampanji za predsjenika napravile jedno pravo novinarsko istraživanje o njemu, preporučam za pročitati)…. ili barem stavite SDPov analitičar da čitatelj dobije kontekst njegovog komentara.

  2. Karai Puku

    Karai Puku

    22. 04. 2020. u 3:28 pm Odgovori

    dobro je da postoje volonteri, ljudi koji u ovom teškom trenutku za zemlju imaju volje energije i znanja pomoći konstruktivnom kritikom. Što bismo bez njih? Ne bismo znali prepoznati epidemiju, razlikovati eksponencijalni od linearnog rasta, nabaviti tisuće kompleta zaštitne opreme, izolirati virus, organizirati liječenje i testiranje, odgovoriti na stotine tisuća poziva epidemiologu.
    Bez šale, i bez zle namjere, svi koji su spremni biti epidemiolozi iz naslonjača, puno bi pomogli hrvatskom društvu, građanima kad bi se, u trenutcima kad nisu zauzeti visokostručnim poslom konstruktivne kritike, uključili u konkretni posao, na primjer volontirali na dežurnom telefonu epidemiologa i preuzeli barem dio posla
    To su vrhunski inteligenti ljudi, koji znaju engleski, prate mrežne sadržaje, o COVID virusu znaju katkad i više od infektologa, o borbi protiv pandemije više od epidemiologa, znaju podatke analizirati, vizualizirati ali aktualna vlast ne prihvaća njihovu pomoć
    Dođite, nazovite, pitajte. Ima puno načina na koji bi pametni ljudi dobre volje mogli pomoći ako hoće

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Kultura 2.0

Dinamo je prvi hrvatski sportski ICO, kupite njihov $DZG token za 2 eura – i uključite se u klupske odluke!

Nakon brojnih drugih velikih klubova hrvatski nogometni prvak odlučio se na iskorak u blockchain svijet kroz novi model članstva. U "inicijalnoj ponudi tokena” od 29. rujna moći ćete postati vlasnik fan tokena Dinama s kojima ćete moći trgovati i sudjelovati u određenim odlukama kluba. Što to znači za kripto dioničare, koja je motivacija kluba za ovaj projekt i tko stoji iza Sociosa istražili smo iz prve ruke.

Intervju

Splitski Blank s partnerima uskoro lansira hrvatski NFT marketplace na Ethereumu!

Uz bok nekolicine renomiranih umjetnika suvremene umjetničke scene, a pod vodstvom splitske agencije Blank, stiže nam Endemic platforma za trgovanje NFT umjetninama. Više o projektu otkrivamo od samih pokretača.

Digitalni marketing

Prima se rebrendirala: Što (i tko) stoji iza prepoznatljivog, a inovativanog vizualnog identiteta?

Od obiteljske tvrtke do poslovnog sustava s više od 2000 zaposlenih. Prima je u posljednjih 25 godina poprilično odmaknula od svojih početaka, stoga je bilo krajnje vrijeme za vizualni identitet koji bi odražavao takvu promjenu.

Što ste propustili

Novost

HAVC prvi put raspisao natječaj za poticanje razvoja i proizvodnje videoigara

Hrvatski gaming studiji dobili su još jednu priliku za financiranje svojih projekata i to u Hrvatskoj!

Intervju

Photomath ima tim specijaliziran za animirane instrukcije koje se programiraju? I to bez pisanja koda?

Jeste li znali da čak 60% učenika koristi video za pomoć pri učenju matematike? Photomath danas nudi i vizualni način učenja matematike pomoću animiranih instrukcija. Uz njih korisnik ima dojam kao da pred sobom ima instruktora matematike, a mi smo provjerili kako se takve animacije uopće kreiraju uz Andriju Ražnatovića i Janu Čičko.

Startupi i poslovanje

Omega software postaje dio M SAN grupacije

I službeno je potvrđeno, drugi najveći sistemski integrator u Hrvatskoj, King ICT u sastavu grupacije M SAN, preuzeo je Omega software.

Kultura 2.0

Naš mozak nije poput ladica koje možemo neprestano puniti informacijama, kako mu pomoći da pamti bitno?

Svi smo se u jednom trenutku zapitali zašto ne mogu bolje pamtiti, odgovor na to pitanje otkrili smo na zagrebačkom TEDx-u!

Startupi i poslovanje

“Pristup top-down, gdje menadžment sam, ili skupa s HR-om osmisli vrijednosti tvrtke, je passé”

Nakon što se hrvatskom SofaScoreu u samo godinu i pol dana udvostručio broj zaposlenika, bilo je sigurno kako treba transformirati i internu kulturu koja će pratiti takav strelovit rast - a to je značilo ispitati vrijednosti sa svim ljudima u tvrtki.

Startupi i poslovanje

AI2FUTURE: “Odgovornost za izgradnju ekosustava prebačena je na tvrtke poput Infobipa i Photomatha”

Unatoč novim nadama koji su pitchali na AI2FUTURE konferenciji, izgradnju AI ekosustava u Hrvatskoj uvelike otežava što sve veći broj domaćih AI stručnjaka radi na daljinu za strane kompanije, a suradnja sa stručnjacima iz akademije je otežana...