Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Može li se data science konačno ograditi od hypea koji ga prati - da se više prakticira, a manje priča u prazno? Može! Dokazale su to predavačice, stručnjakinje iz znanosti i industrije, koje su prezentirale svoje projekte na ovogodišnjem izdanju Women in Data Science konferencije. Naučili smo mnogo, a između ostalog i kako se tvrtke trebaju pripremiti za data science timove i projekte.

U četvrtak 5. ožujka održano je 3. izdanje Women in Data Science konferencije u Hrvatskoj. Iz Osijeka opet smo se vratili u Zagreb, u HUB385, gdje se okupilo više od 150 sudionika, kako iz industrije, tako i iz znanosti.

Kroz više od deset predavanja, studija slučaja i panela, program je obuhvatio različite prakse i iskustva u primjeni podatkovne znanosti u Hrvatskoj. Već smo imali priliku podijeliti dirljivu priču podatkovne znanstvenice Ane Dumić, koja je praćenjem podataka i njihovom analizom spasila svog sina. A da je podatkovna znanost zbilja primjenjiva u svim sferama društva, pokazala nam je prof.dr.sc. Marina Ivašić-Kos, koja nam je objasnila kako automatskim praćenjem i analizom aktivnosti sportaša u rukometnim scenama možemo pomoći i sportašima i njihovim trenerima.

No, i uz sve te primjere, čini se kao da se o podatkovnoj znanosti još uvijek više priča, a manje radi. Toj priči ne pomaže ni cijeli niz buzzworda i fraza kojima se nepotrebno zamagljuju okolnosti razvoja data science timova i projekata. Upravo je panel: “Manje priče, više podataka – razumijemo li zaista što donosi data science?” osmišljen kako bi otvorio ključna pitanja koji mogu potaknuti promjene, a o čemu su uz moderatoricu Mirjanu Domazet-Lošo, docenticu pri Zavodu za primijenjeno računarstvo na FER-u, raspravljale Sanda Martinčić-Ipšić, profesorica Odjela za informatiku pri Sveučilištu u Rijeci, Lucija Iličić, sudionica Mastercardovog projekta “1u4 milijuna: kako smo ostvarili svoj san u Hrvatskoj” i predstavnica Mastercarda u panelu, te Kristina Reicher, BI konzultantica Koios consultinga.

WiDS 2020

Što rade naše žene u podatkovnoj znanosti?

Iako su podaci malo drugačiji, u akademiji i industriji metode analize podataka su slične, ističe Mirjana. Nije stoga bilo teško pronaći zajednički jezik među sugovornicama. Uostalom, svaka od ovih stručnjakinja ima jednak cilj: unaprijediti razinu podatkovne znanosti u Hrvatskoj – da li adekvatnim obrazovanjem talenata ili usavršavanjem procesa jednog data science tima odnosno projekta.

Sanda Martinčić-Ipšić je tako na Sveučilištu u Rijeci dijelom povezana s podatkovnom znanosti i kroz kolegije na kojima predaje, ali i kroz istraživanja koja radi. U okviru projekata uglavnom je zanima računalna obrada jezika, teksta i govora. Tako se Sanda imala priliku baviti istraživanjem sadržaja na društvenim mrežama, konkretno analizom sentimenta tweetova koji su se dijelili na vrhuncu migrantske krize.

Kristina Reicher  pak, iako danas u konzultantskom svijetu, oduvijek je u karijeri bila nekako vezana uz bankarski sektor, što je donekle i razumljivo za stručnjakinju s diplomom iz matematičke statistike. Ljubav prema velikim skupovima podataka ostala je s njom te se i nakon izlaska iz svijeta bankarstva podučavala i polirala svoje vještine na otvorenim podacima.

I Kristina i Sanda ušle su u svijet podataka s tehničkom odnosno statističkom pozadinom. S druge strane, Lucija Iličić, diplomirana je psihologica koja je nakon studija napravila zaokret prema podatkovnoj analizi. Kroz svoju karijeru u industriji se najčešće bavila istraživanjem o ljudskom ponašanju pa i psihologijom organizacije rada.

Moje znanje iz psihologije omogućilo mi je da operacionaliziram podatke koje imamo o ljudskom ponašanju, osim toga, u podatkovnu analizu donijela sam i znanje o metodologijama istraživanja.

Upravo smo se tako uz Luciju dotakli i jednog od bitnih pitanja, s obzirom na nedostatak DS stručnjaka, koliko velik doprinos non-STEM stručnjaci donose u područje podatkovne znanosti?

Podatkovna znanost treba i non-STEMovce

Na Mirjanino pitanje što bi Luciji danas pomoglo u njenom radu s podacima, a da ju je i fakultet mogao na to pripremiti, Lucija odgovara da bi to sigurno bile generalno znanje o programiranju. Primjerice, da u R-u i Pythonu neke stvari mogu napraviti puno brze nego u SPSS-u ili Statistici.

Također, dodaje Lucija, iako je to najčešće velika mentalna prepreka non-STEM studentima, trebaju biti svjesni da njihovo poznavanje programiranja ne mora biti savršeno jer oni u data science donose druge vještine za koje je njihova ekspertiza važna.

Primjerice, ako ja radim neku regresijsku analizu puno mi je važnije prepoznavanje nekog ponašanja – da je točno određeno ponašanje vezano uz neku od varijabli. Zbog tipa istraživanja i podataka meni nije bilo potrebno savršeno poznavanje programiranja. Uostalom, postoje stvarno kvalitetni online tečajevi koji vam u par mjeseci mogu dati relevantno znanje.

WiDS Zagreb 2020

Lucija napominje i kako bi bilo izvrsno da postoji neka bolja suradnja između fakulteta kako bi studenti mogli kombinirati kolegije s drugih studija. Nažalost, kako znamo na primjeru Sveučilišta u Zagrebu, ono nije organizirano poput kampusa pa bi to bilo pakao uskladiti. Međutim, i panelistice i publika su se složili da tržište pati zbog takvih okolnosti. Jedna od poduzetnica iz publike tako je istaknula da nije rijetkost da IT studenti dolaze često na prve poslove veoma uskih vidika, što zahtijeva minimalno godinu dana dodatnog rada s njima.

Tko ne bi htio biti data stručnjak…

U zadnje dvije godine svjesni smo da se oko podatkovne znanosti dignuo velik hype. Preko noći su po LinkedInu osvanuli deseci novih data science pozicija. Neki statističari veterani, poput profesorice FOI-a iz publike, rekli bi: zašto sad izmišljaju nešto novo pa ja to već odavno radim. I u pravu su – donekle. Data Science se u velikom dijelu oslanja na statistiku, ali DS nije samo statistika, ono obuhvaća programiranje, inženjerstvo, matematiku, dizajn i znanje o znanstvenim metodologijama, da ne spominjemo AI i machine learning zasebno.

Ne čudi stoga, zbog svoje multidisciplinarnosti i statusa da je pozicija podatkovnog znanstvenika već neko vrijeme najtraženiji posao. Nažalost, nekima se budućnost ne čini tako perspektivna kad razmišljaju da će u nekom trenutku sama računala moći obavljati ono što ih oni trenutno uče. Kristina iz Koiosa ipak misli da to nužno neće ugroziti karijere (budućih) podatkovnih znanstvenika:

U zadnje dvije godine došla sam do saznanja da 15% data science stručnjaka i machine learning inženjera razmišljaju o promjeni posla. Ima tu problema… Ali nas čekaju zanimljive promjene, kao to da područja koja nisu tipično tech područja tek ulaze u DS sferu. Po meni, nema straha da ćemo kroz 5 godina ostati bez posla.

Idemo li u dobrom smjeru?

Sanda ističe da Sveučilište u Rijeci trenutno razvija dvije stvari koje mogu biti od značaja budućim data stručnjacima. To je specijalistički studij podatkovnih znanosti i suradnja s varaždinskim FOI-jem na DIP2Future projektu kroz koji će se razviti 4 nova ICT studijska programa.

Mirjana pak dodaje kako se vidi i značajan pomak na razini EU, koja je, primijetivši da se neće moći natjecati s Kinom i SAD-om, napokon uzela stvari u svoje ruke. Krajem veljače objavljeno je par ključnih dokumenata, od kojih i EU Data strategija kojom se planira uspostaviti jedinstveno tržište za podatke.

Iako se na panelu nismo stigli dotaknuti i toga kako možemo iskoristiti otvorene podatke za transparentnost u politici i društvu, voditeljica Katarina Moškatelo je to lijepo zaključila:

Može, ali samo ako društvo to želi. A naše ne želi.

WiDS Zagreb 2020

Primjer za to je i aplikacija za osiguravanje proračunske transparentnosti koja koristi otvorene podatke lokalnih uprava i samouprava kako bi svi mještani i građani mogli vidjeti kako se troši proračunski novac. Pogađate? Jedva se itko javio da ju želi koristiti. Uz iznimku jednog grada – Bjelovara.

Zaključno, panelistice su uglavnom bile jednoglasne oko toga da ima pomaka u Hrvatskoj iako još kasnimo za većinom. Mnogi u publici su se javili s pozitivnim primjerima koji pokazuju kako nismo iza drugih, jedan od primjera je bio i porast broja Data Science zanimanja. Nažalost, kako pokazuje predavanje Kristine Bagarić, vidjet ćemo da otvorene i zauzete DS pozicije u tvrtkama ne znače ništa jer domaće tvrtke često nisu spremne za podatkovne znanstvenike.

Kako onboardati podatkovnog stručnjaka?

Kako izgledaju timovi koji kreiraju machine learning modele; gdje su danas podatkovni znanstvenici smješteni u organizaciji; kako naći odgovarajućeg podatkovnog znanstvenika, samo su neka od pitanja na koje je Kristina Bagarić, inače voditeljica odsjeka za planiranje i koordinaciju u Hrvatskom telekomu, nastojala donijeti odgovore. Kako stoji istaknuto u njezinoj biografiji, imati dostupne velike količine podataka nije prednost ako tim nema odgovarajuće alate i razvijen osjećaj za sagledavanje svih faktora koji utječu na donošenje zaključaka i interpretaciju rezultata. Kristina zato inzistira na stvaranju preduvjeta i razvoju pozitivnog okruženja za razvoj stručnjaka u tim područjima.

Od niza karakteristika dobrog podatkovnog znanstvenika, Kristina ističe i par najvažnijih. Oni definitivno moraju biti timski igrači. Tehničke vještine su važne, ali to ne znači da business vještine nisu, dapače. Moraju biti proaktivni, ne nužno samostalni u radu koliko moraju pokazati samoinicijativu. A povrh svega stoji taj istraživački duh (znanstvenika) koji će ih gurati da kopaju dalje kad se čini da nema izlaza.

S druge strane, što treba osigurati tvrtka koja zapošljava data science stručnjaka?

Kao prvo podatke. U kontekstu njih, to znači da netko stručnjaka mora uvesti u podatke, podatci prethodno moraju biti dokumentirani i lako dostupni, a onaj tko uvodi osobu u njih, treba i naglasiti ako su pojedini setovi podataka nečisti. Potom, infrastrukturu. Ne možete računati da ste podatkovnom stručnjaku riješili alat tako što ste mu dali samo laptop. Uz server, svakako želite razviti i distribuiranu okolinu koja podržava povezivanje.

Kad već i dovedete data scientista u svoju tvrtku, ako nema pripremljeno mjesto za rad – to nije ništa drugo nego – loše.

Zato tvrtke, pazite kako brinete i da li se dobro pripremate za svoje (buduće) data science stručnjake i timove. Uz to, ne zaboravite na vrijeme:

Nema napretka bez istraživanja, ali ako ne damo ljudima da si uzmu vrijeme da istraže sve što trebaju, nego ih stalno ometamo ad hoc zadacima, teško će se išta napraviti.

Uz to, teško je sve poželjne vještine naći u jednoj osobi, stoga je dobro posložen tim za operacionalizaciju također stup DS-a u tvrtkama. Za kraj onda mogu samo poželjeti da se ovim principima vode ostale hrvatske tvrtke koje zapošljavaju DS stručnjake i stručnjakinje kako bi i sljedeći Women in Data Science imao dobrih primjera iz prakse.

Za sve one koji nažalost nisu mogli doći na ovogodišnji WiDS, ili se žele prisjetiti nečega što su propustili, cijeli događaj dostupan je na YouTubeu.

Molimo da prihvatite sve kolačiće kako biste mogli vidjeti ovaj sadržaj

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Ekskluzivno

57hours Viktora Marohnića narastao 4 puta i osigurao još 2,75 milijuna dolara

U ekskluzivnom intervjuu za Netokraciju, suosnivač brzorastuće avanturističke platforme Viktor Marohnić, sa svojim investitorima, otkriva planove.

Tvrtke i poslovanje

7 savjeta za učinkovitu izradu poslovnog plana (posebno za one koji nemaju vremena)

Nisu bez razloga velikani povijesti od Sun Tzua do Dwight D. Eisenhowera pričali o planiranju kao o svetom gralu uspjeha - i ne stoji bez razloga ona narodna: dobra organizacija je pola posla.

Novost

Peta kriptomarka Hrvatske pošte su neponovljivi profesor Baltazar i njegovi izumi

Peto izdanje kriptomarke, koja dolazi u analognom i digitalnom obliku, Hrvatska pošta pustila je u optjecaj!

Što ste propustili

Netokracija Podcast

Zašto je ovogodišnji Infobip Shift bio za nas najgori, ali i najbolji?

Infobip Shift za nas nije počeo idealno, ali je završio savršeno. Otkrili smo više o umjetnoj inteligenciji i developerskoj produktivnosti te snimili ispovijesti 6 startupa o izazovima, atmosferi među VC-jevima i planovima za iduću godinu.

Tvrtke i poslovanje

16 lekcija koje sam kao suvlasnik digitalne agencije naučio o poslovanju u SAD-u

Pet godina redovito posjećujem SAD, ne bih li upoznao zemlju i proširio poslovanje naše agencije na to tržište. Puno se toga razlikuje od Hrvatske i Europe općenito, a u ovom tekstu dijelim najvažnije lekcije. 

Tvrtke i poslovanje

Sretan mu 25. rođendan: Kako smo počeli koristiti Googleove proizvode – i zašto (ne)ćemo nastaviti?

Povodom Googleovog rođendana prisjećamo se njegove prošlosti, nepobitnog utjecaja na sve digitalno što danas radimo, ali gledamo i u blisku budućnost koju će obilježiti dvije ključne riječi - umjetna inteligencija i monopol. Nismo propustili priliku ni nostalgično se prisjetiti pozivnica za Gmail, Googleovih pokušaja da napravi društvenu mrežu ili prvih susreta s Googleom, što je za neke zapravo bio YouTube.

Novost

U ZICER-u startupe čeka 150.000 eura, a prijave za akceleracijske programe traju još samo ovaj tjedan

Vodeći hrvatski startup hub ZICER otvorio i program za uspješno lansiranje na globalno tržište.

Intervju

500 tisuća korisnika koristi tehnologiju ovog hrvatskog AI startupa

S vremena na vrijeme, pojavi se neki startup koji marljivo radi "ispod radara", a onda odluči podijeliti svoju priču. Prvi donosimo intervju s TensorPixom koji od nedavno broji preko pola milijuna korisnika.

Izvještaj

Lekcije inženjerke iz Shopifya: kako koristiti AI za brži, bolji i lakši razvoj softvera?

Umjetna inteligencija i inženjeri. Nekada se vole, nekada mrze, ali činjenica je da AI inženjerima može olakšati pisanje koda... (ako i sami znaju što rade).