
Znanost o podacima na svjetskoj razini: Imamo kadar, imamo znanje, imamo izvrsne primjere…
Women in Data Science konferencija premašila je očekivanja svih koji su prisustvovali i sudjelovali. Zagrebačka inačica okupila je skoro 200 stručnjaka iz akademske zajednice i industrije, kao i mnoštvo studenata i drugih zainteresiranih u podatkovne znanosti, na izvrsnom programu koji je pokazao da Hrvatska itekako ide u korak sa svjetskim trendovima i zahtjevima tržišta.
Ova jednodnevna konferencija prošle je godine na 80 lokacija u 30 zemalja širila znanje o novim tehnologijama i istraživanjima vezanima uz obradu i korištenje podataka.
Iako je konferencija na neki način istaknula 8. ožujka, Međunarodni dan kojim obilježavamo borbu za prava i ravnopravnost žena, ovo nije konferencija namijenjena ženama. U Zagrebu se na WiDS-u okupilo itekako mnogo muškaraca što potvrđuje činjenicu da se ‘women’ u nazivu odnosi tek na to da su na konferenciji žene bile predavačice, a konferencija je tu da ih podrži u njihovom radu.
WiDS je okupio nekoliko izvrsnih znanstvenica, profesorica, ali i stručnjakinja iz industrije kako bi prikazale načine na koje fakulteti šire znanje o tom području, kao i vodeća poduzeća koja koriste podatkovnu znanost za svoj rast i razvoj.
Konferenciju je izvorno pokrenula Judy Logan na Stanfordu 2015. godine, gdje se i dalje redovito održava. Za domaću inačicu zaslužna je Andrea Knez Karačić do koje je stanfordski tim WiDS-a došao preko preporuke, kada su htjeli ovaj događaj proširiti globalno.
Andrea je uz podršku agencije Wanderlust Events, sponzora i brojnih prijatelja konferencije, organizirala uspješnu zagrebačku inačicu, a u nastavku vam donosimo malo detalja od pojedinih predavanja i panela da vas zagrijemo za iduće izdanje.
Što obuhvaća podatkovna znanost?
Iz statistike, strojnog učenja, umjetne inteligencije, rudarenja podataka i otkrivanja znanja u velikim količinama podataka izvire novo područje – znanost o podacima.
To je i ključ u vezi podatkovne znanosti, ona je interdisciplinarna, naglašava Bojana Dalbelo Bašić, redovita profesorica na Fakultetu elektrotehnike i računarstva u Zagrebu koja je otvorila konferenciju pregledom izvora i izazova koje donosi ovo relativno novo područje.
Jedan od izazova podatkovne znanosti jest stvoriti sinergiju različitih pristupa i dati novu bogatiju interpretaciju rezultata analize, a da pritom ne upadnemo u zamku misleći da su nam alati uspjeli riješiti problem. Jer najbitniji i najkompleksniji dio znanosti o podacima dolazi upravo nakon što alati obave svoje pretrage, objašnjava Dalbelo Bašić:
Danas postoji ogromna količna podataka, koja iz dana u dan sve više raste, no bez obzira na tu količinu, nas zanima znanje koje je zapleteno u tim podacima i ključno pitanje novih tehnologija i našeg napretka je u tome kako doći do tog znanja.
Profesorica je istaknula i par udruženja u Hrvatskoj koji su zaslužni za unaprjeđenje primjene znanosti o podacima u mnogim područjima, a posebno Hrvatsko biometrijsko društvo i Hrvatsko statističko društvo koje već dugi niz godina na predsjedničkom mandatu ima upravo žene.
Pošto 8. ožujka jest označen kao Dan žena, važno je onda spomenuti i neke činjenice, na koje su se osvrnule i mnoge predavačice. U svijetu se broj žena koje se bave podatkovnim znanostima kreće od oko 10 do 20%, a žena u znanosti ukupno ima tek 28%. No, barem se u Hrvatskoj možemo pohvaliti podacima Hrvatskog statističkog zavoda koji navode da znanstvenica u Hrvatskoj ima sve više, skoro 50%!
Osim uspješnih žena u znanosti, WiDS je posebno obilježilo mnoštvo uspješnih projekata. Možda je najveći doprinos konferencije upravo otkrivanje pravih potencijala, kako žena tako i velike količine podataka :).
Podaci bez kraja, ali sa svrhom.
Svaki put kada vi provučete karticu, mi znamo gdje je obavljena transakcija, koliko je novca preneseno, kome je preneseno i zbog čega – a osim toga i znamo koliko imate godina, jeste li muško ili žensko i gdje živite.
Ukratko su okupljenima objasnile Jasna Fumagalli, direktorica sektora za compliance, sigurnost i upravljanje rizicima te Irina Bručić, direktorica sektora financija iz Mercury Processinga, na predavanju ‘Monetizacija podataka susreće zaštitu podataka‘. Naravno, svi smo se nasmijali, i progutali knedlu.
Zamislite milijune takvih transakcija koje se mjesečno odviju, i to govorimo tek o jednom malom segmentu našeg života, plaćanju karticama. Što je s informacijama koje se skupljaju putem aplikacija, pametnih uređaja ili pak Netflixa?
Svijet će do 2020. nagomilati 16 zetabajta podataka. Imate li ideju koliko je to? Pošto danas većina ljudi najbolje shvaća pojmove veličine podatka u megabajtima i gigabajtima, e pa to je jedan trilijun gigabajta (1,000,000,000,000). Što možemo s time?
Mnogo toga, pokazale su nam predavačice WiDS-a.
Što se podatkovnog radi u Hrvatskoj?

Od analize društvenih mreža za okorjele digitalne marketingaše do monetizacije podataka za konzultantske kuće. Primjera ima itekako.
Telekomi raspolažu s jednim od najvećih baza korisnika. Zamislite da imate personalizirani sustav zasnovan na obradi velike količine podataka iz telekomunikacijske mreže koji izračunava najidealniji poklon za korisnika. Već učinjeno, a više smo čuli od Antonije Mušćet, inženjerke iz Ericssona Nikola Tesla.
Zamislite programski sustav koji automatizirano procjenjuje točnost studentski radova. Raj za preopterećene sveučilišne nastavnike, a za studente pravovremeno i dosljedno ocjenjivanje? I više nego moguće, potvrdila nam je Ljiljana Brkić, docentica sa Zavoda za primijenjeno računarstvo na FER-u.
A što kažete na optimizaciju rezervacije smještaja u vrhuncu sezone kada su cijene previsoke i time gubici otkazivanja još veći? Helena Kmetić iz Cantab Analytica govorila je o razvoju rješenja za ‘overbooking‘ hotela. Oni su trome excelice i emailove bacili u zaborav uz pomoć algoritama koji mijenjaju cijene u realnom vremenu, tražeći optimalnu cjenovnu razinu te vizualizaciju koja pomaže menadžerima da donose brze odluke.
Profesorica Dalbelo Bašić predstavila je i istraživački projekt koji vodi na FER-u. Riječ je o TakeLabu, laboratoriju za analizu teksta i inženjerstvo znanja. U sklopu njega, studenti, profesori i specijalisti s FER-a radili su na nekoliko zanimljivih projekata poput:
- Vizualizacije ključnih događaja i ljudi kroz period od 20 godina u dnevnicima The New York Times i Le Monde,
- Otkrivanja prijevara u auto osiguranju te
- Analize sentimenta i mišljenja korisnika telekomunikacijskih usluga na društvenim mrežama.
Osim toga, sigurno se iz TakeLaba najviše ponose svojim projektom CADIAL kroz koji razvijaju semantički pretraživač hrvatske pravne dokumentacije, a koji se radi u partnerstvu sa Središnjim državnim uredom za razvoj digitalnog društva i uz pomoć 13 milijuna eura iz Strukturnih fondova EU.
Podaci su itekako IN i u Hrvatskoj, u to možemo biti sigurni, no jesmo li u koraku i sa zahtjevima tržišta rada?
Podatkovna znanost je najseksi posao 21. stoljeća.

Kako je najavljeno u uvodu panela ‘Edukacija u podatkovnoj znanosti‘, u svijetu je teško pronaći veće tehnološko sveučilište koje ne nudi neki studijski program u vezi znanosti o podacima, a mnoga izvješća potvrđuju kako su stručnjaci za znanost o podacima najtraženiji i najbolje plaćeni kadar na tržištu rada.
O tome prati li hrvatska znanstvena scena trendove na tržištu, moderatorica Anela Husković iz Microsofta razgovarala je s Janom Žiljak Gršić, pročelnicom IR odjela TVZ-a, Lidijom Šimrak, voditeljicom odjela za međunarodnu suradnju na Algebri, Mirtom Baranović, profesoricom FER-a na Zavodu za primijenjeno računarstvo i Snježanom Rimac-Drlje, profesoricom s FERiT-a.
Iako osnivanje novih odjela, kako navodi profesorica Mirta Baranović zahtjeva izdašne pripreme zbog rigidnosti sustava (jer, birokracija), i TVZ i FER u narednih par godina očekuju nove inačice studijskih programa. Tehničko veleučilište u Zagrebu već ove jeseni otvara novi specijalistički diplomski stručni studij ‘Informacijska sigurnost i digitalna forenzika‘, što je posebno relevantno za znanost o podacima čiji se ubrzan razvoj sve više veže uz zaštitu i sigurnost podataka.
Fakultet elektrotehnike i računarstva je također u pripremama za realizaciju novog FER 3 programa koji će revidirati postojeće studije kako bi se dodatno prilagodili današnjem i budućem tržištu rada. Osim toga, profesorica Baranović ističe kako FER već godinama održava kolegije koji se tiču podatkovnih znanosti i da je svaki student kroz izbornost kolegija u mogućnosti da kroji svoje usmjerenje i buduću specijalizaciju, što je potvrdila i Anela Husković iz Microsofta koja je svoj diplomski upravo zbog stečenih znanja i interesa u tom području, radila na temu Bayesovih mreža za detekciju stanja vozača u polu-autonomnim vozilima u njemačkom BMW R&D odjelu.
FERIT u Osijeku ima i posebno usmjerenje Informacijskih i podatkovnih znanosti, a profesorica Snježana Rimac-Drlje posebno ističe koliko je u stvaranju budućih studijskih programa koji se tiču novih tehnologija, važna suradnja sa stručnjacima iz industrije:
Fakulteti nemaju sva znanja da se takvi studiji pravovremeno pokrenu, ali industrija je ta koja može i treba dati svoj input.
Osim fakulteta, na internetu je moguće pronaći niz tečajeva koji nude potpune specijalizacije za sve koji bi htjeli i nakon studentskih dana unaprijediti svoja postojeća znanja. Jedan od poznatijih je Data Specialization na Courseri.

Zabilježite za ubuduće…
Hrvatska itekako prati svjetske trendove, samo možda malo kaskamo na razini opće svjesnosti o mogućnostima koje donose nove tehnologije. Zato je i konferencija poput WiDS-a potrebna kako bi svim skepticima pokazali da ništa od ovoga nije toliko opskurno i neizvedivo uz postojeći stručni kadar i buduće specijaliste.
Možda je za kraj najbolje najaviti par događaja koji su vezani uz znanost o podacima. U petom mjesecu, za sve koje zanima digitalna ekonomija u kontekstu podatkovnih znanosti tu je novo izdanje Data Science Economy konferencije.
Ako se još ne osjećate dovoljno sigurni u svoje razumijevanje teme, tečajeva ima i van internetske zone – HUB385 Akademija redovito organizira tečajeve vezane uz Big Data te duboko i strojno učenje.
Inače, za neke meetupe u daljoj budućnosti, uvijek je dobro pregledati novosti na Data Science Hrvatsta koje je postala svojevrsno udruženje svih zainteresiranih u ovo područje. Na zajedničkim okupljanjima imat ćete priliku upoznati svijet podataka uz primjere iz svijeta poduzetništva, ali i iz svakodnevnog života, a sva predavanja su besplatna.
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.
Pravila ponašanja
Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:
Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.
Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.