
Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki
Može li se data science konačno ograditi od hypea koji ga prati - da se više prakticira, a manje priča u prazno? Može! Dokazale su to predavačice, stručnjakinje iz znanosti i industrije, koje su prezentirale svoje projekte na ovogodišnjem izdanju Women in Data Science konferencije. Naučili smo mnogo, a između ostalog i kako se tvrtke trebaju pripremiti za data science timove i projekte.
U četvrtak 5. ožujka održano je 3. izdanje Women in Data Science konferencije u Hrvatskoj. Iz Osijeka opet smo se vratili u Zagreb, u HUB385, gdje se okupilo više od 150 sudionika, kako iz industrije, tako i iz znanosti.
Kroz više od deset predavanja, studija slučaja i panela, program je obuhvatio različite prakse i iskustva u primjeni podatkovne znanosti u Hrvatskoj. Već smo imali priliku podijeliti dirljivu priču podatkovne znanstvenice Ane Dumić, koja je praćenjem podataka i njihovom analizom spasila svog sina. A da je podatkovna znanost zbilja primjenjiva u svim sferama društva, pokazala nam je prof.dr.sc. Marina Ivašić-Kos, koja nam je objasnila kako automatskim praćenjem i analizom aktivnosti sportaša u rukometnim scenama možemo pomoći i sportašima i njihovim trenerima.
No, i uz sve te primjere, čini se kao da se o podatkovnoj znanosti još uvijek više priča, a manje radi. Toj priči ne pomaže ni cijeli niz buzzworda i fraza kojima se nepotrebno zamagljuju okolnosti razvoja data science timova i projekata. Upravo je panel: “Manje priče, više podataka – razumijemo li zaista što donosi data science?” osmišljen kako bi otvorio ključna pitanja koji mogu potaknuti promjene, a o čemu su uz moderatoricu Mirjanu Domazet-Lošo, docenticu pri Zavodu za primijenjeno računarstvo na FER-u, raspravljale Sanda Martinčić-Ipšić, profesorica Odjela za informatiku pri Sveučilištu u Rijeci, Lucija Iličić, sudionica Mastercardovog projekta “1u4 milijuna: kako smo ostvarili svoj san u Hrvatskoj” i predstavnica Mastercarda u panelu, te Kristina Reicher, BI konzultantica Koios consultinga.

Što rade naše žene u podatkovnoj znanosti?
Iako su podaci malo drugačiji, u akademiji i industriji metode analize podataka su slične, ističe Mirjana. Nije stoga bilo teško pronaći zajednički jezik među sugovornicama. Uostalom, svaka od ovih stručnjakinja ima jednak cilj: unaprijediti razinu podatkovne znanosti u Hrvatskoj – da li adekvatnim obrazovanjem talenata ili usavršavanjem procesa jednog data science tima odnosno projekta.
Sanda Martinčić-Ipšić je tako na Sveučilištu u Rijeci dijelom povezana s podatkovnom znanosti i kroz kolegije na kojima predaje, ali i kroz istraživanja koja radi. U okviru projekata uglavnom je zanima računalna obrada jezika, teksta i govora. Tako se Sanda imala priliku baviti istraživanjem sadržaja na društvenim mrežama, konkretno analizom sentimenta tweetova koji su se dijelili na vrhuncu migrantske krize.
Kristina Reicher pak, iako danas u konzultantskom svijetu, oduvijek je u karijeri bila nekako vezana uz bankarski sektor, što je donekle i razumljivo za stručnjakinju s diplomom iz matematičke statistike. Ljubav prema velikim skupovima podataka ostala je s njom te se i nakon izlaska iz svijeta bankarstva podučavala i polirala svoje vještine na otvorenim podacima.
I Kristina i Sanda ušle su u svijet podataka s tehničkom odnosno statističkom pozadinom. S druge strane, Lucija Iličić, diplomirana je psihologica koja je nakon studija napravila zaokret prema podatkovnoj analizi. Kroz svoju karijeru u industriji se najčešće bavila istraživanjem o ljudskom ponašanju pa i psihologijom organizacije rada.
Moje znanje iz psihologije omogućilo mi je da operacionaliziram podatke koje imamo o ljudskom ponašanju, osim toga, u podatkovnu analizu donijela sam i znanje o metodologijama istraživanja.
Upravo smo se tako uz Luciju dotakli i jednog od bitnih pitanja, s obzirom na nedostatak DS stručnjaka, koliko velik doprinos non-STEM stručnjaci donose u područje podatkovne znanosti?
Podatkovna znanost treba i non-STEMovce
Na Mirjanino pitanje što bi Luciji danas pomoglo u njenom radu s podacima, a da ju je i fakultet mogao na to pripremiti, Lucija odgovara da bi to sigurno bile generalno znanje o programiranju. Primjerice, da u R-u i Pythonu neke stvari mogu napraviti puno brze nego u SPSS-u ili Statistici.
Također, dodaje Lucija, iako je to najčešće velika mentalna prepreka non-STEM studentima, trebaju biti svjesni da njihovo poznavanje programiranja ne mora biti savršeno jer oni u data science donose druge vještine za koje je njihova ekspertiza važna.
Primjerice, ako ja radim neku regresijsku analizu puno mi je važnije prepoznavanje nekog ponašanja – da je točno određeno ponašanje vezano uz neku od varijabli. Zbog tipa istraživanja i podataka meni nije bilo potrebno savršeno poznavanje programiranja. Uostalom, postoje stvarno kvalitetni online tečajevi koji vam u par mjeseci mogu dati relevantno znanje.

Lucija napominje i kako bi bilo izvrsno da postoji neka bolja suradnja između fakulteta kako bi studenti mogli kombinirati kolegije s drugih studija. Nažalost, kako znamo na primjeru Sveučilišta u Zagrebu, ono nije organizirano poput kampusa pa bi to bilo pakao uskladiti. Međutim, i panelistice i publika su se složili da tržište pati zbog takvih okolnosti. Jedna od poduzetnica iz publike tako je istaknula da nije rijetkost da IT studenti dolaze često na prve poslove veoma uskih vidika, što zahtijeva minimalno godinu dana dodatnog rada s njima.
Tko ne bi htio biti data stručnjak…
U zadnje dvije godine svjesni smo da se oko podatkovne znanosti dignuo velik hype. Preko noći su po LinkedInu osvanuli deseci novih data science pozicija. Neki statističari veterani, poput profesorice FOI-a iz publike, rekli bi: zašto sad izmišljaju nešto novo pa ja to već odavno radim. I u pravu su – donekle. Data Science se u velikom dijelu oslanja na statistiku, ali DS nije samo statistika, ono obuhvaća programiranje, inženjerstvo, matematiku, dizajn i znanje o znanstvenim metodologijama, da ne spominjemo AI i machine learning zasebno.
Ne čudi stoga, zbog svoje multidisciplinarnosti i statusa da je pozicija podatkovnog znanstvenika već neko vrijeme najtraženiji posao. Nažalost, nekima se budućnost ne čini tako perspektivna kad razmišljaju da će u nekom trenutku sama računala moći obavljati ono što ih oni trenutno uče. Kristina iz Koiosa ipak misli da to nužno neće ugroziti karijere (budućih) podatkovnih znanstvenika:
U zadnje dvije godine došla sam do saznanja da 15% data science stručnjaka i machine learning inženjera razmišljaju o promjeni posla. Ima tu problema… Ali nas čekaju zanimljive promjene, kao to da područja koja nisu tipično tech područja tek ulaze u DS sferu. Po meni, nema straha da ćemo kroz 5 godina ostati bez posla.
Idemo li u dobrom smjeru?
Sanda ističe da Sveučilište u Rijeci trenutno razvija dvije stvari koje mogu biti od značaja budućim data stručnjacima. To je specijalistički studij podatkovnih znanosti i suradnja s varaždinskim FOI-jem na DIP2Future projektu kroz koji će se razviti 4 nova ICT studijska programa.
Mirjana pak dodaje kako se vidi i značajan pomak na razini EU, koja je, primijetivši da se neće moći natjecati s Kinom i SAD-om, napokon uzela stvari u svoje ruke. Krajem veljače objavljeno je par ključnih dokumenata, od kojih i EU Data strategija kojom se planira uspostaviti jedinstveno tržište za podatke.
Iako se na panelu nismo stigli dotaknuti i toga kako možemo iskoristiti otvorene podatke za transparentnost u politici i društvu, voditeljica Katarina Moškatelo je to lijepo zaključila:
Može, ali samo ako društvo to želi. A naše ne želi.

Primjer za to je i aplikacija za osiguravanje proračunske transparentnosti koja koristi otvorene podatke lokalnih uprava i samouprava kako bi svi mještani i građani mogli vidjeti kako se troši proračunski novac. Pogađate? Jedva se itko javio da ju želi koristiti. Uz iznimku jednog grada – Bjelovara.
Zaključno, panelistice su uglavnom bile jednoglasne oko toga da ima pomaka u Hrvatskoj iako još kasnimo za većinom. Mnogi u publici su se javili s pozitivnim primjerima koji pokazuju kako nismo iza drugih, jedan od primjera je bio i porast broja Data Science zanimanja. Nažalost, kako pokazuje predavanje Kristine Bagarić, vidjet ćemo da otvorene i zauzete DS pozicije u tvrtkama ne znače ništa jer domaće tvrtke često nisu spremne za podatkovne znanstvenike.
Kako onboardati podatkovnog stručnjaka?
Kako izgledaju timovi koji kreiraju machine learning modele; gdje su danas podatkovni znanstvenici smješteni u organizaciji; kako naći odgovarajućeg podatkovnog znanstvenika, samo su neka od pitanja na koje je Kristina Bagarić, inače voditeljica odsjeka za planiranje i koordinaciju u Hrvatskom telekomu, nastojala donijeti odgovore. Kako stoji istaknuto u njezinoj biografiji, imati dostupne velike količine podataka nije prednost ako tim nema odgovarajuće alate i razvijen osjećaj za sagledavanje svih faktora koji utječu na donošenje zaključaka i interpretaciju rezultata. Kristina zato inzistira na stvaranju preduvjeta i razvoju pozitivnog okruženja za razvoj stručnjaka u tim područjima.
Od niza karakteristika dobrog podatkovnog znanstvenika, Kristina ističe i par najvažnijih. Oni definitivno moraju biti timski igrači. Tehničke vještine su važne, ali to ne znači da business vještine nisu, dapače. Moraju biti proaktivni, ne nužno samostalni u radu koliko moraju pokazati samoinicijativu. A povrh svega stoji taj istraživački duh (znanstvenika) koji će ih gurati da kopaju dalje kad se čini da nema izlaza.
S druge strane, što treba osigurati tvrtka koja zapošljava data science stručnjaka?
Kao prvo podatke. U kontekstu njih, to znači da netko stručnjaka mora uvesti u podatke, podatci prethodno moraju biti dokumentirani i lako dostupni, a onaj tko uvodi osobu u njih, treba i naglasiti ako su pojedini setovi podataka nečisti. Potom, infrastrukturu. Ne možete računati da ste podatkovnom stručnjaku riješili alat tako što ste mu dali samo laptop. Uz server, svakako želite razviti i distribuiranu okolinu koja podržava povezivanje.
Kad već i dovedete data scientista u svoju tvrtku, ako nema pripremljeno mjesto za rad – to nije ništa drugo nego – loše.
Zato tvrtke, pazite kako brinete i da li se dobro pripremate za svoje (buduće) data science stručnjake i timove. Uz to, ne zaboravite na vrijeme:
Nema napretka bez istraživanja, ali ako ne damo ljudima da si uzmu vrijeme da istraže sve što trebaju, nego ih stalno ometamo ad hoc zadacima, teško će se išta napraviti.
Uz to, teško je sve poželjne vještine naći u jednoj osobi, stoga je dobro posložen tim za operacionalizaciju također stup DS-a u tvrtkama. Za kraj onda mogu samo poželjeti da se ovim principima vode ostale hrvatske tvrtke koje zapošljavaju DS stručnjake i stručnjakinje kako bi i sljedeći Women in Data Science imao dobrih primjera iz prakse.
Za sve one koji nažalost nisu mogli doći na ovogodišnji WiDS, ili se žele prisjetiti nečega što su propustili, cijeli događaj dostupan je na YouTubeu.
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.
Pravila ponašanja
Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:
Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.
Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.