Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Treći Women in Data Science otkrio nam je što podatkovne znanstvenice mogu, ali i što trebaju od svojih tvrtki

Može li se data science konačno ograditi od hypea koji ga prati - da se više prakticira, a manje priča u prazno? Može! Dokazale su to predavačice, stručnjakinje iz znanosti i industrije, koje su prezentirale svoje projekte na ovogodišnjem izdanju Women in Data Science konferencije. Naučili smo mnogo, a između ostalog i kako se tvrtke trebaju pripremiti za data science timove i projekte.

U četvrtak 5. ožujka održano je 3. izdanje Women in Data Science konferencije u Hrvatskoj. Iz Osijeka opet smo se vratili u Zagreb, u HUB385, gdje se okupilo više od 150 sudionika, kako iz industrije, tako i iz znanosti.

Kroz više od deset predavanja, studija slučaja i panela, program je obuhvatio različite prakse i iskustva u primjeni podatkovne znanosti u Hrvatskoj. Već smo imali priliku podijeliti dirljivu priču podatkovne znanstvenice Ane Dumić, koja je praćenjem podataka i njihovom analizom spasila svog sina. A da je podatkovna znanost zbilja primjenjiva u svim sferama društva, pokazala nam je prof.dr.sc. Marina Ivašić-Kos, koja nam je objasnila kako automatskim praćenjem i analizom aktivnosti sportaša u rukometnim scenama možemo pomoći i sportašima i njihovim trenerima.

No, i uz sve te primjere, čini se kao da se o podatkovnoj znanosti još uvijek više priča, a manje radi. Toj priči ne pomaže ni cijeli niz buzzworda i fraza kojima se nepotrebno zamagljuju okolnosti razvoja data science timova i projekata. Upravo je panel: “Manje priče, više podataka – razumijemo li zaista što donosi data science?” osmišljen kako bi otvorio ključna pitanja koji mogu potaknuti promjene, a o čemu su uz moderatoricu Mirjanu Domazet-Lošo, docenticu pri Zavodu za primijenjeno računarstvo na FER-u, raspravljale Sanda Martinčić-Ipšić, profesorica Odjela za informatiku pri Sveučilištu u Rijeci, Lucija Iličić, sudionica Mastercardovog projekta “1u4 milijuna: kako smo ostvarili svoj san u Hrvatskoj” i predstavnica Mastercarda u panelu, te Kristina Reicher, BI konzultantica Koios consultinga.

WiDS 2020

Što rade naše žene u podatkovnoj znanosti?

Iako su podaci malo drugačiji, u akademiji i industriji metode analize podataka su slične, ističe Mirjana. Nije stoga bilo teško pronaći zajednički jezik među sugovornicama. Uostalom, svaka od ovih stručnjakinja ima jednak cilj: unaprijediti razinu podatkovne znanosti u Hrvatskoj – da li adekvatnim obrazovanjem talenata ili usavršavanjem procesa jednog data science tima odnosno projekta.

Sanda Martinčić-Ipšić je tako na Sveučilištu u Rijeci dijelom povezana s podatkovnom znanosti i kroz kolegije na kojima predaje, ali i kroz istraživanja koja radi. U okviru projekata uglavnom je zanima računalna obrada jezika, teksta i govora. Tako se Sanda imala priliku baviti istraživanjem sadržaja na društvenim mrežama, konkretno analizom sentimenta tweetova koji su se dijelili na vrhuncu migrantske krize.

Kristina Reicher  pak, iako danas u konzultantskom svijetu, oduvijek je u karijeri bila nekako vezana uz bankarski sektor, što je donekle i razumljivo za stručnjakinju s diplomom iz matematičke statistike. Ljubav prema velikim skupovima podataka ostala je s njom te se i nakon izlaska iz svijeta bankarstva podučavala i polirala svoje vještine na otvorenim podacima.

I Kristina i Sanda ušle su u svijet podataka s tehničkom odnosno statističkom pozadinom. S druge strane, Lucija Iličić, diplomirana je psihologica koja je nakon studija napravila zaokret prema podatkovnoj analizi. Kroz svoju karijeru u industriji se najčešće bavila istraživanjem o ljudskom ponašanju pa i psihologijom organizacije rada.

Moje znanje iz psihologije omogućilo mi je da operacionaliziram podatke koje imamo o ljudskom ponašanju, osim toga, u podatkovnu analizu donijela sam i znanje o metodologijama istraživanja.

Upravo smo se tako uz Luciju dotakli i jednog od bitnih pitanja, s obzirom na nedostatak DS stručnjaka, koliko velik doprinos non-STEM stručnjaci donose u područje podatkovne znanosti?

Podatkovna znanost treba i non-STEMovce

Na Mirjanino pitanje što bi Luciji danas pomoglo u njenom radu s podacima, a da ju je i fakultet mogao na to pripremiti, Lucija odgovara da bi to sigurno bile generalno znanje o programiranju. Primjerice, da u R-u i Pythonu neke stvari mogu napraviti puno brze nego u SPSS-u ili Statistici.

Također, dodaje Lucija, iako je to najčešće velika mentalna prepreka non-STEM studentima, trebaju biti svjesni da njihovo poznavanje programiranja ne mora biti savršeno jer oni u data science donose druge vještine za koje je njihova ekspertiza važna.

Primjerice, ako ja radim neku regresijsku analizu puno mi je važnije prepoznavanje nekog ponašanja – da je točno određeno ponašanje vezano uz neku od varijabli. Zbog tipa istraživanja i podataka meni nije bilo potrebno savršeno poznavanje programiranja. Uostalom, postoje stvarno kvalitetni online tečajevi koji vam u par mjeseci mogu dati relevantno znanje.

WiDS Zagreb 2020

Lucija napominje i kako bi bilo izvrsno da postoji neka bolja suradnja između fakulteta kako bi studenti mogli kombinirati kolegije s drugih studija. Nažalost, kako znamo na primjeru Sveučilišta u Zagrebu, ono nije organizirano poput kampusa pa bi to bilo pakao uskladiti. Međutim, i panelistice i publika su se složili da tržište pati zbog takvih okolnosti. Jedna od poduzetnica iz publike tako je istaknula da nije rijetkost da IT studenti dolaze često na prve poslove veoma uskih vidika, što zahtijeva minimalno godinu dana dodatnog rada s njima.

Tko ne bi htio biti data stručnjak…

U zadnje dvije godine svjesni smo da se oko podatkovne znanosti dignuo velik hype. Preko noći su po LinkedInu osvanuli deseci novih data science pozicija. Neki statističari veterani, poput profesorice FOI-a iz publike, rekli bi: zašto sad izmišljaju nešto novo pa ja to već odavno radim. I u pravu su – donekle. Data Science se u velikom dijelu oslanja na statistiku, ali DS nije samo statistika, ono obuhvaća programiranje, inženjerstvo, matematiku, dizajn i znanje o znanstvenim metodologijama, da ne spominjemo AI i machine learning zasebno.

Ne čudi stoga, zbog svoje multidisciplinarnosti i statusa da je pozicija podatkovnog znanstvenika već neko vrijeme najtraženiji posao. Nažalost, nekima se budućnost ne čini tako perspektivna kad razmišljaju da će u nekom trenutku sama računala moći obavljati ono što ih oni trenutno uče. Kristina iz Koiosa ipak misli da to nužno neće ugroziti karijere (budućih) podatkovnih znanstvenika:

U zadnje dvije godine došla sam do saznanja da 15% data science stručnjaka i machine learning inženjera razmišljaju o promjeni posla. Ima tu problema… Ali nas čekaju zanimljive promjene, kao to da područja koja nisu tipično tech područja tek ulaze u DS sferu. Po meni, nema straha da ćemo kroz 5 godina ostati bez posla.

Idemo li u dobrom smjeru?

Sanda ističe da Sveučilište u Rijeci trenutno razvija dvije stvari koje mogu biti od značaja budućim data stručnjacima. To je specijalistički studij podatkovnih znanosti i suradnja s varaždinskim FOI-jem na DIP2Future projektu kroz koji će se razviti 4 nova ICT studijska programa.

Mirjana pak dodaje kako se vidi i značajan pomak na razini EU, koja je, primijetivši da se neće moći natjecati s Kinom i SAD-om, napokon uzela stvari u svoje ruke. Krajem veljače objavljeno je par ključnih dokumenata, od kojih i EU Data strategija kojom se planira uspostaviti jedinstveno tržište za podatke.

Iako se na panelu nismo stigli dotaknuti i toga kako možemo iskoristiti otvorene podatke za transparentnost u politici i društvu, voditeljica Katarina Moškatelo je to lijepo zaključila:

Može, ali samo ako društvo to želi. A naše ne želi.

WiDS Zagreb 2020

Primjer za to je i aplikacija za osiguravanje proračunske transparentnosti koja koristi otvorene podatke lokalnih uprava i samouprava kako bi svi mještani i građani mogli vidjeti kako se troši proračunski novac. Pogađate? Jedva se itko javio da ju želi koristiti. Uz iznimku jednog grada – Bjelovara.

Zaključno, panelistice su uglavnom bile jednoglasne oko toga da ima pomaka u Hrvatskoj iako još kasnimo za većinom. Mnogi u publici su se javili s pozitivnim primjerima koji pokazuju kako nismo iza drugih, jedan od primjera je bio i porast broja Data Science zanimanja. Nažalost, kako pokazuje predavanje Kristine Bagarić, vidjet ćemo da otvorene i zauzete DS pozicije u tvrtkama ne znače ništa jer domaće tvrtke često nisu spremne za podatkovne znanstvenike.

Kako onboardati podatkovnog stručnjaka?

Kako izgledaju timovi koji kreiraju machine learning modele; gdje su danas podatkovni znanstvenici smješteni u organizaciji; kako naći odgovarajućeg podatkovnog znanstvenika, samo su neka od pitanja na koje je Kristina Bagarić, inače voditeljica odsjeka za planiranje i koordinaciju u Hrvatskom telekomu, nastojala donijeti odgovore. Kako stoji istaknuto u njezinoj biografiji, imati dostupne velike količine podataka nije prednost ako tim nema odgovarajuće alate i razvijen osjećaj za sagledavanje svih faktora koji utječu na donošenje zaključaka i interpretaciju rezultata. Kristina zato inzistira na stvaranju preduvjeta i razvoju pozitivnog okruženja za razvoj stručnjaka u tim područjima.

Od niza karakteristika dobrog podatkovnog znanstvenika, Kristina ističe i par najvažnijih. Oni definitivno moraju biti timski igrači. Tehničke vještine su važne, ali to ne znači da business vještine nisu, dapače. Moraju biti proaktivni, ne nužno samostalni u radu koliko moraju pokazati samoinicijativu. A povrh svega stoji taj istraživački duh (znanstvenika) koji će ih gurati da kopaju dalje kad se čini da nema izlaza.

S druge strane, što treba osigurati tvrtka koja zapošljava data science stručnjaka?

Kao prvo podatke. U kontekstu njih, to znači da netko stručnjaka mora uvesti u podatke, podatci prethodno moraju biti dokumentirani i lako dostupni, a onaj tko uvodi osobu u njih, treba i naglasiti ako su pojedini setovi podataka nečisti. Potom, infrastrukturu. Ne možete računati da ste podatkovnom stručnjaku riješili alat tako što ste mu dali samo laptop. Uz server, svakako želite razviti i distribuiranu okolinu koja podržava povezivanje.

Kad već i dovedete data scientista u svoju tvrtku, ako nema pripremljeno mjesto za rad – to nije ništa drugo nego – loše.

Zato tvrtke, pazite kako brinete i da li se dobro pripremate za svoje (buduće) data science stručnjake i timove. Uz to, ne zaboravite na vrijeme:

Nema napretka bez istraživanja, ali ako ne damo ljudima da si uzmu vrijeme da istraže sve što trebaju, nego ih stalno ometamo ad hoc zadacima, teško će se išta napraviti.

Uz to, teško je sve poželjne vještine naći u jednoj osobi, stoga je dobro posložen tim za operacionalizaciju također stup DS-a u tvrtkama. Za kraj onda mogu samo poželjeti da se ovim principima vode ostale hrvatske tvrtke koje zapošljavaju DS stručnjake i stručnjakinje kako bi i sljedeći Women in Data Science imao dobrih primjera iz prakse.

Za sve one koji nažalost nisu mogli doći na ovogodišnji WiDS, ili se žele prisjetiti nečega što su propustili, cijeli događaj dostupan je na YouTubeu.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome)
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime (Hrvoje Lončar) ili barem ime i inicijala (Hrvoje L.) te pravu email adresu. Kako koristimo podatke koje tamo ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Analiza

2014. imala sam 10.000 Dogecoina. Danas, kad im je Elon Musk “napumpao” vrijednost, više ih nemam

Možda sam imala i više od 11.000. Možda sam i dobar dio podijelila, teško se prisjetiti tih opskurnih događaja prije gotovo sedam godina kada nismo više bili sigurni što je kriptovaluta, a što meme. A što oboje istodobno.

Startupi i poslovanje

Hoćete li kupiti rabljeni auto preko interneta, pitali smo osnivača Neostara (s 20 godina iskustva u industriji)

Insajder automobilske industrije, od spinoffa Zubak grupe želi stvoriti platformu koja će nam olakšati kupnju i prodaju rabljenih automobila u kojoj nećemo trebati "prijatelja koji se kuži u aute". Hrvatska im je pilot projekt, ali ambicije puno veće!

Web aplikacije

Osvanuo portal cijepise.zdravlje.hr, za prijavu za cjepivo protiv koronavirusa

A u trenutku pisanja ovog teksta nije izgledao ni približno dovršeno.

Što ste propustili

Digitalni marketing

Što marketing može naučiti od pametnih klupa… zahvaljujući “machine learning” inženjerki!

Pametne klupe - osim što su pametne, izvrstan su način digitalnog vanjskog oglašavanja. Kako strojno učenje i računalni vid pospješuju uspješnost tog segmenta poslovanja? Više nam je otkrila Includeova Nina Erceg.

Kultura 2.0

Bandcamp Friday: zašto baš danas trebate kupiti glazbu na ovoj platformi? Znaju Tomislav Capan, Intek Music i Elemental!

Danas je prvi petak u mjesecu, što znači da možete nabaviti gomilu super glazbe na Bandcampu za super cijene i podržati izvođače u ovom razdoblju bez koncerata... Što sve donosi inicijativa koja je oduševila glazbenika diljem svijeta, otkrivamo:

Digitalni marketing

Interaktivan video stigao u Konzum webshop: Kako su objedinili dobar sadržaj s ecommerceom?

Integraciju prodaje proizvoda unutar foto oglasa već ste sigurno vidjeli po Instagramu, no uglavnom takvi ecommerce trendovi sporo dolaze do nas. A možda i ne... Konzum u svome webshopu ide korak dalje. Za svoje proizvode pripremili su interaktivne video recepte!

Startupi i poslovanje

Five akviziran za 250 milijuna kuna: Marohnić i Abrus o ulasku u svjetsku ligu digitalnih agencija!

Viktor Marohnić i Luka Abrus u ekskluzivnom intervjuu za Netokraciju otkrivaju planove za Five kao dijela Endave, jedne od najvećih razvojnih grupacija na svijetu.

Kultura 2.0

Šizite od toga kako se komunicira u vašoj tvrtki? Ispunite anketu!

Koliko puta ste promatrajući različite rasprave i obavijesti u svojoj tvrtki pomislili: Zašto se ovo nije moglo reći ranije, direktno, anonimno, jasnije, kasnije... zanimljivije?

Kultura 2.0

Jesam li lijen developer ako mi treba PlayStation pauza na poslu?

Ja: “Ajme ne mogu na kavu. Satra sam se na poslu. Baš bi odmoria danas." Ekipa: “Ne laži, kako si se umoria. Na poslu samo igraš PlayStation!“