Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Može li se data science konačno ograditi od hypea koji ga prati - da se više prakticira, a manje priča u prazno? Može! Dokazale su to predavačice, stručnjakinje iz znanosti i industrije, koje su prezentirale svoje projekte na ovogodišnjem izdanju Women in Data Science konferencije. Naučili smo mnogo, a između ostalog i kako se tvrtke trebaju pripremiti za data science timove i projekte.

U četvrtak 5. ožujka održano je 3. izdanje Women in Data Science konferencije u Hrvatskoj. Iz Osijeka opet smo se vratili u Zagreb, u HUB385, gdje se okupilo više od 150 sudionika, kako iz industrije, tako i iz znanosti.

Kroz više od deset predavanja, studija slučaja i panela, program je obuhvatio različite prakse i iskustva u primjeni podatkovne znanosti u Hrvatskoj. Već smo imali priliku podijeliti dirljivu priču podatkovne znanstvenice Ane Dumić, koja je praćenjem podataka i njihovom analizom spasila svog sina. A da je podatkovna znanost zbilja primjenjiva u svim sferama društva, pokazala nam je prof.dr.sc. Marina Ivašić-Kos, koja nam je objasnila kako automatskim praćenjem i analizom aktivnosti sportaša u rukometnim scenama možemo pomoći i sportašima i njihovim trenerima.

No, i uz sve te primjere, čini se kao da se o podatkovnoj znanosti još uvijek više priča, a manje radi. Toj priči ne pomaže ni cijeli niz buzzworda i fraza kojima se nepotrebno zamagljuju okolnosti razvoja data science timova i projekata. Upravo je panel: “Manje priče, više podataka – razumijemo li zaista što donosi data science?” osmišljen kako bi otvorio ključna pitanja koji mogu potaknuti promjene, a o čemu su uz moderatoricu Mirjanu Domazet-Lošo, docenticu pri Zavodu za primijenjeno računarstvo na FER-u, raspravljale Sanda Martinčić-Ipšić, profesorica Odjela za informatiku pri Sveučilištu u Rijeci, Lucija Iličić, sudionica Mastercardovog projekta “1u4 milijuna: kako smo ostvarili svoj san u Hrvatskoj” i predstavnica Mastercarda u panelu, te Kristina Reicher, BI konzultantica Koios consultinga.

WiDS 2020

Što rade naše žene u podatkovnoj znanosti?

Iako su podaci malo drugačiji, u akademiji i industriji metode analize podataka su slične, ističe Mirjana. Nije stoga bilo teško pronaći zajednički jezik među sugovornicama. Uostalom, svaka od ovih stručnjakinja ima jednak cilj: unaprijediti razinu podatkovne znanosti u Hrvatskoj – da li adekvatnim obrazovanjem talenata ili usavršavanjem procesa jednog data science tima odnosno projekta.

Sanda Martinčić-Ipšić je tako na Sveučilištu u Rijeci dijelom povezana s podatkovnom znanosti i kroz kolegije na kojima predaje, ali i kroz istraživanja koja radi. U okviru projekata uglavnom je zanima računalna obrada jezika, teksta i govora. Tako se Sanda imala priliku baviti istraživanjem sadržaja na društvenim mrežama, konkretno analizom sentimenta tweetova koji su se dijelili na vrhuncu migrantske krize.

Kristina Reicher  pak, iako danas u konzultantskom svijetu, oduvijek je u karijeri bila nekako vezana uz bankarski sektor, što je donekle i razumljivo za stručnjakinju s diplomom iz matematičke statistike. Ljubav prema velikim skupovima podataka ostala je s njom te se i nakon izlaska iz svijeta bankarstva podučavala i polirala svoje vještine na otvorenim podacima.

I Kristina i Sanda ušle su u svijet podataka s tehničkom odnosno statističkom pozadinom. S druge strane, Lucija Iličić, diplomirana je psihologica koja je nakon studija napravila zaokret prema podatkovnoj analizi. Kroz svoju karijeru u industriji se najčešće bavila istraživanjem o ljudskom ponašanju pa i psihologijom organizacije rada.

Moje znanje iz psihologije omogućilo mi je da operacionaliziram podatke koje imamo o ljudskom ponašanju, osim toga, u podatkovnu analizu donijela sam i znanje o metodologijama istraživanja.

Upravo smo se tako uz Luciju dotakli i jednog od bitnih pitanja, s obzirom na nedostatak DS stručnjaka, koliko velik doprinos non-STEM stručnjaci donose u područje podatkovne znanosti?

Podatkovna znanost treba i non-STEMovce

Na Mirjanino pitanje što bi Luciji danas pomoglo u njenom radu s podacima, a da ju je i fakultet mogao na to pripremiti, Lucija odgovara da bi to sigurno bile generalno znanje o programiranju. Primjerice, da u R-u i Pythonu neke stvari mogu napraviti puno brze nego u SPSS-u ili Statistici.

Također, dodaje Lucija, iako je to najčešće velika mentalna prepreka non-STEM studentima, trebaju biti svjesni da njihovo poznavanje programiranja ne mora biti savršeno jer oni u data science donose druge vještine za koje je njihova ekspertiza važna.

Primjerice, ako ja radim neku regresijsku analizu puno mi je važnije prepoznavanje nekog ponašanja – da je točno određeno ponašanje vezano uz neku od varijabli. Zbog tipa istraživanja i podataka meni nije bilo potrebno savršeno poznavanje programiranja. Uostalom, postoje stvarno kvalitetni online tečajevi koji vam u par mjeseci mogu dati relevantno znanje.

WiDS Zagreb 2020

Lucija napominje i kako bi bilo izvrsno da postoji neka bolja suradnja između fakulteta kako bi studenti mogli kombinirati kolegije s drugih studija. Nažalost, kako znamo na primjeru Sveučilišta u Zagrebu, ono nije organizirano poput kampusa pa bi to bilo pakao uskladiti. Međutim, i panelistice i publika su se složili da tržište pati zbog takvih okolnosti. Jedna od poduzetnica iz publike tako je istaknula da nije rijetkost da IT studenti dolaze često na prve poslove veoma uskih vidika, što zahtijeva minimalno godinu dana dodatnog rada s njima.

Tko ne bi htio biti data stručnjak…

U zadnje dvije godine svjesni smo da se oko podatkovne znanosti dignuo velik hype. Preko noći su po LinkedInu osvanuli deseci novih data science pozicija. Neki statističari veterani, poput profesorice FOI-a iz publike, rekli bi: zašto sad izmišljaju nešto novo pa ja to već odavno radim. I u pravu su – donekle. Data Science se u velikom dijelu oslanja na statistiku, ali DS nije samo statistika, ono obuhvaća programiranje, inženjerstvo, matematiku, dizajn i znanje o znanstvenim metodologijama, da ne spominjemo AI i machine learning zasebno.

Ne čudi stoga, zbog svoje multidisciplinarnosti i statusa da je pozicija podatkovnog znanstvenika već neko vrijeme najtraženiji posao. Nažalost, nekima se budućnost ne čini tako perspektivna kad razmišljaju da će u nekom trenutku sama računala moći obavljati ono što ih oni trenutno uče. Kristina iz Koiosa ipak misli da to nužno neće ugroziti karijere (budućih) podatkovnih znanstvenika:

U zadnje dvije godine došla sam do saznanja da 15% data science stručnjaka i machine learning inženjera razmišljaju o promjeni posla. Ima tu problema… Ali nas čekaju zanimljive promjene, kao to da područja koja nisu tipično tech područja tek ulaze u DS sferu. Po meni, nema straha da ćemo kroz 5 godina ostati bez posla.

Idemo li u dobrom smjeru?

Sanda ističe da Sveučilište u Rijeci trenutno razvija dvije stvari koje mogu biti od značaja budućim data stručnjacima. To je specijalistički studij podatkovnih znanosti i suradnja s varaždinskim FOI-jem na DIP2Future projektu kroz koji će se razviti 4 nova ICT studijska programa.

Mirjana pak dodaje kako se vidi i značajan pomak na razini EU, koja je, primijetivši da se neće moći natjecati s Kinom i SAD-om, napokon uzela stvari u svoje ruke. Krajem veljače objavljeno je par ključnih dokumenata, od kojih i EU Data strategija kojom se planira uspostaviti jedinstveno tržište za podatke.

Iako se na panelu nismo stigli dotaknuti i toga kako možemo iskoristiti otvorene podatke za transparentnost u politici i društvu, voditeljica Katarina Moškatelo je to lijepo zaključila:

Može, ali samo ako društvo to želi. A naše ne želi.

WiDS Zagreb 2020

Primjer za to je i aplikacija za osiguravanje proračunske transparentnosti koja koristi otvorene podatke lokalnih uprava i samouprava kako bi svi mještani i građani mogli vidjeti kako se troši proračunski novac. Pogađate? Jedva se itko javio da ju želi koristiti. Uz iznimku jednog grada – Bjelovara.

Zaključno, panelistice su uglavnom bile jednoglasne oko toga da ima pomaka u Hrvatskoj iako još kasnimo za većinom. Mnogi u publici su se javili s pozitivnim primjerima koji pokazuju kako nismo iza drugih, jedan od primjera je bio i porast broja Data Science zanimanja. Nažalost, kako pokazuje predavanje Kristine Bagarić, vidjet ćemo da otvorene i zauzete DS pozicije u tvrtkama ne znače ništa jer domaće tvrtke često nisu spremne za podatkovne znanstvenike.

Kako onboardati podatkovnog stručnjaka?

Kako izgledaju timovi koji kreiraju machine learning modele; gdje su danas podatkovni znanstvenici smješteni u organizaciji; kako naći odgovarajućeg podatkovnog znanstvenika, samo su neka od pitanja na koje je Kristina Bagarić, inače voditeljica odsjeka za planiranje i koordinaciju u Hrvatskom telekomu, nastojala donijeti odgovore. Kako stoji istaknuto u njezinoj biografiji, imati dostupne velike količine podataka nije prednost ako tim nema odgovarajuće alate i razvijen osjećaj za sagledavanje svih faktora koji utječu na donošenje zaključaka i interpretaciju rezultata. Kristina zato inzistira na stvaranju preduvjeta i razvoju pozitivnog okruženja za razvoj stručnjaka u tim područjima.

Od niza karakteristika dobrog podatkovnog znanstvenika, Kristina ističe i par najvažnijih. Oni definitivno moraju biti timski igrači. Tehničke vještine su važne, ali to ne znači da business vještine nisu, dapače. Moraju biti proaktivni, ne nužno samostalni u radu koliko moraju pokazati samoinicijativu. A povrh svega stoji taj istraživački duh (znanstvenika) koji će ih gurati da kopaju dalje kad se čini da nema izlaza.

S druge strane, što treba osigurati tvrtka koja zapošljava data science stručnjaka?

Kao prvo podatke. U kontekstu njih, to znači da netko stručnjaka mora uvesti u podatke, podatci prethodno moraju biti dokumentirani i lako dostupni, a onaj tko uvodi osobu u njih, treba i naglasiti ako su pojedini setovi podataka nečisti. Potom, infrastrukturu. Ne možete računati da ste podatkovnom stručnjaku riješili alat tako što ste mu dali samo laptop. Uz server, svakako želite razviti i distribuiranu okolinu koja podržava povezivanje.

Kad već i dovedete data scientista u svoju tvrtku, ako nema pripremljeno mjesto za rad – to nije ništa drugo nego – loše.

Zato tvrtke, pazite kako brinete i da li se dobro pripremate za svoje (buduće) data science stručnjake i timove. Uz to, ne zaboravite na vrijeme:

Nema napretka bez istraživanja, ali ako ne damo ljudima da si uzmu vrijeme da istraže sve što trebaju, nego ih stalno ometamo ad hoc zadacima, teško će se išta napraviti.

Uz to, teško je sve poželjne vještine naći u jednoj osobi, stoga je dobro posložen tim za operacionalizaciju također stup DS-a u tvrtkama. Za kraj onda mogu samo poželjeti da se ovim principima vode ostale hrvatske tvrtke koje zapošljavaju DS stručnjake i stručnjakinje kako bi i sljedeći Women in Data Science imao dobrih primjera iz prakse.

Za sve one koji nažalost nisu mogli doći na ovogodišnji WiDS, ili se žele prisjetiti nečega što su propustili, cijeli događaj dostupan je na YouTubeu.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome)
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime (Hrvoje Lončar) ili barem ime i inicijala (Hrvoje L.) te pravu email adresu. Kako koristimo podatke koje tamo ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Analiza

Bitcoin obara rekorde: Prešao vrijednost 23.000 dolara (i konačno dospio u medije nakon 2017.)

Kako se Bitcoin uspoređuje s hrvatskom kunom? I zašto, osim ako ne pratite aktivno vijesti o njemu, niste o Bitcoinu puno čuli od 2017. naovamo - sve dok nije počeo ponovno obarati rekorde?

Tehnologija

Može i bez tvornica: Hrvatska kao “meka” za R&D automobilske industrije!

2020. je za domaći IT donijela mnogo dobrih vijesti, a kakav potencijal naši stručnjaci donose za industriju automobila u 2021. i narednim godinama otkrili su nam Tomislav Car (Porsche Digital Croatia) i predstavnici dSPACE Engineeringa.

Startupi i poslovanje

Hrvatski Electrocoin otkriva kako su ih proizvodi za kriptovalute doveli do 330 milijuna kuna godišnjeg prometa

Krajem 2020. uvršteni su u sam vrh Deloitte Fast 50 ljestvice, imaju 3 proizvoda, a osim što sami rastu, u zadnje vrijeme bujaju i kriptovalute kojima su posvetili svoje poslovanje. Bio nam je to dobar povod da s jednim od direktora Electrocoina, Nikolom Škorićem, razgovaramo o izazovima vođenja hrvatskog poduzeća koje se bavi kriptovalutama.

Što ste propustili

Tehnologija

7 lekcija koje možemo naučiti iz najvažnije godine za online trgovinu!

eCommerce eksplozija otkrila je dragulje i jame - mnogi su se u 2020. našli pred velikim izazovima; neki jer im online trgovina nikada nije bila opcija, drugi jer su prihvaćali svakakva rješenja u zadnji čas - rijetki su pobrali vrhnje jer su prepoznali potencijal mnogo ranije.

Startupi i poslovanje

Tipsy vam u Zagrebu dostavlja piće unutar 3 sata – uz pomoć Craft Technology softvera

Radi se o novom brendu Wine&morea, koji su postojeću logistiku i softver iskoristili za ciljanje domaće, mlađe publike. Osim što su dokazali da u kratkom roku mogu pokrenuti novi brend, Tipsy im je poslužio i kao studija slučaja za vlastiti softver, kako za Netokraciju otkrivaju Ivan Kovačević i Dario Drmač.

Mobilno

Skinuli ste i Telegram i Signal, a niste znali: EU Hrvatima štiti podatke od WhatsAppa!

Elon Musk tweetne: "Koristite Signal". Internet poludi. Bismo li ga trebali poslušati i zašto?

Novost

Anita Lacmanović postala nova generalna direktorica SAP-a Hrvatska

Anita Lacmanović nova je generalna direktorica SAP-a Hrvatska, a njezino vođenje tvrtke obilježit će nova strategija s jasnim fokusom na ubrzani prelazak korisnika na rješenja u oblaku te predanost uspjehu postojećih i budućih SAP-ovih klijenata, stoji u priopćenju.

Kultura 2.0

Incijativa digitalca iz Siska osigurala gotovo 1.000.000 kuna za pomoć Glini, Petrinji i okolici

Siščanin Goran Kovačević odmah je nakon prvog prošlogodišnjeg potresa u Petrinji pokrenuo crowdfunding kampanju za pomoć svima pogođenima potresom. Brojimo još samo nekoliko dana prije isteka!

Kultura 2.0

Hrvatski znanstvenici pripremaju veliko istraživanje o komunikaciji u koronakrizi – na Twitteru, YouTubeu i Redditu!

(Dez)informacije o koronavirusu ne jenjavaju ni godinu dana od početka pandemije, dapače, njihovo širenje na društvenim mrežama samo raste. Kako te poruke utječu na stavove Hrvata? Uskoro će nam više otkriti domaći znanstvenici i stručnjaci metodama iz područja obrade prirodnoga jezika, dubokog učenja i analize društvenih mreža.