Kako uz strojno učenje u Microblinku držimo korak s tehnološkim napretkom

Strojno učenje je u zadnjih nekoliko godina pridobilo veliku pozornost akademske zajednice, industrije te javnosti općenito. Razlog tome je opravdan, algoritmi su po prvi puta u povijesti počeli rješavati određene probleme bolje od čovjeka. Iako se to područje razvija još od pedesetih godina, potrebna je bila kombinacija napretka u hardveru i dostupnosti velike količine podataka kako bi se došlo do priželjkivanih rezultata. Danas strojno učenje daje ‘state-of-the-art’ rezultate na većini problema u području računalnog vida, a velikom brzinom ulazi i u ostala područja računarstva.

NIPS Microblink

No, što to konkretno znači za jednu tvrtku? Mišljenja sam da većina ne shvaća značaj nedavnih promjena u ovom području. Strojno učenje nije samo još jedan od algoritama koji bi inženjeri trebali uključiti u svoja rješenja, to je preokret u načinu rješavanja problema u računarstvu općenito. Da bi se jedna firma mogla pohvaliti da zasniva svoju tehnologiju na strojnom učenju, potrebna je promjena u načinu poslovanja te razvijanja i razmišljanja svih zaposlenika. Demonstrirat ću vam to na našem primjeru u Microblinku, gdje smo u potpunosti prešli na strojno učenje vrlo rano u odnosu na našu konkurenciju.

Microblink razvija visoko optimizirana rješenja računalnog vida za mobilne uređaje, s naglaskom na tzv. OCR tehnologiju. Glavne odlike naše tehnologije koje klijenti od početka hvale su izrazito brzo izvođenje te velika preciznost i pouzdanost naših algoritama. Dobra rješenja rezultat su konstantnog akademskog istraživanja, beskompromisnog stava prema optimizaciji i, prije svega, odlične komunikacije unutar firme – od direktora do studenta na ljetnoj praksi.

Upravo ta razina komunikacije pokazala se ključnom za brzo i uspješno uvođenje strojnog učenja. Sama ideja i inicijalna demonstracija nove paradigme proizašla je iz diplomskog rada studenta, no za promjenu bilo je potrebno razumijevanje na razini cijele firme. Razvijanje postojeće tehnologije računalnog vida obustavilo se na skoro dvije godine kako bi se uložili resursi i vrijeme u nešto što se tada činilo poprilično riskantno. 

Sve je u podacima

U klasičnom pristupu razvijanja algoritama bez učenja inženjer preuzima na sebe donošenje svih odluka prilikom implementacije rješenja. U strojnom učenju te odluke donose se automatizirano, odnosno uče se na podacima. Stoga uspješnost takvog algoritma izravno ovisi o količini i kvaliteti podataka. Koliko dobro pokrijete domenu problema sa svojim podacima, toliko dobro će se vaš algoritam ponašati.

Ono što se iz našeg iskustva nije pokazalo intuitivno je količina podataka koja se podrazumijeva kada se kaže “puno”. Deset tisuća u strojnom učenju nije velik broj, radi se o potrebi za podacima u milijunskim iznosima. Prikupljanje, pohranjivanje i upravljanje tolikom količinom podataka postaje zaseban izazov, zbog čega Microblink ima poseban tim koji se bavi samo time.

Sustav za učenje

Zahvaljujući javno dostupnim alatima za učenje poput TensorFlowa (koji i sami koristimo), razvijanje prototipa rješenja strojnog učenja je relativno jednostavno. Dojam koji općenito ostavlja nova paradigma je da se radi o plug-n-play pristupu rješavanja problema, odnosno da nije potrebno puno truda i razumijevanja za dobivanje dobrog rješenja. Taj dojam se znatno mijenja prilikom rada na konkretnim problemima u industriji gdje su potrebni state-of-the-art rezultati uz velika ograničenja na kompleksnosti modela.

Kod razvijanja takvih rješenja potreban je detaljan uvid u proces učenja, ponašanje naučenih modela, kao i svojstva podataka na kojima se uči. Stoga se u Microblinku veliki dio vremena i resursa ulaže upravo u razvijanje sustava za učenje koji nam to omogućuje. Neke odlike dosad razvijenog sustava su: mogućnost prikupljanja i upravljanja ogromnim količinama podataka, brzo učenje na GPU serverima čiji broj konstantno raste te detaljna analiza naučenih modela po pitanju preciznosti, ali i performansi na mobilnim uređajima. Konačni cilj je da strojno učenje postane standardni alat unutar cijele firme kako bi se primijenio i izvan naše core tehnologije.

Optimiziranje za mobilne uređaje

Jedan od problema strojnog učenja je da su naučeni modeli koji daju dobre rezultate često preveliki za korištenje na mobilnim uređajima. Stoga većina rješenja u industriji ima neki oblik izvođenja na serveru kako bi se što brže došlo do rezultata modela. Naravno, takav pristup ima svoje mane, kao što je potreba za internetskom vezom i nemogućnost izvođenja u stvarnom vremenu. S obzirom na prethodno spomenuto inzistiranje Microblinka po pitanju performansi, vrlo rano smo počeli s razvijanjem našeg optimiziranog izvođača naučenih modela na mobilnim uređajima. Danas imamo cijeli tim ljudi koji radi na njegovom razvoju te se možemo pohvaliti s dvostruko bržim izvođenjem naših modela u odnosu na Googleov TensorFlow.

Naš najveći projekt dosad je prepoznavanje rukom pisanih jednadžbi za Photomath, u sklopu kojeg smo razvili po našim saznanjima prvi na svijetu u potpunosti učen model za OCR koji radi u stvarnom vremenu na mobilnom uređaju.

Photomath app instantly scans and solves math problems right from your notebook.

Znanost i edukacija

Ono na čemu bi Hrvatska sigurno trebala poraditi je mjera u kojoj industrija surađuje s fakultetima. Iz našeg iskustva nemoguće je razvijati konkurentnu visoku tehnologiju bez konstantnog akademskog istraživanja. Stoga je velik dio Microblinkovih projekata organiziran u suradnji s određenim zavodima na FER-u, a nastojimo proširiti tu suradnju i na ostale fakultete kojima smo u mogućnosti ponuditi konkretne i studentima zanimljive projekte.

Strojno učenje se u praksi zna poprilično razlikovati od teorije, stoga je naš najveći doprinos studentima upravo iskustvo iz industrije. Kako bi što brže to iskustvo prenijeli, ali i popunili eventualne rupe u znanju, naši inženjeri vode redovitu internu edukaciju za studente.

Na taj način studenti u Microblinku vrlo brzo steknu dovoljnu razinu znanja i iskustva za rad na ozbiljnim i izazovnim problemima u industriji.

Naš je najveći izazov, a vjerujemo i za ostale tehnološke firme koje razvijaju konkurentna rješenja, držanje koraka s izrazito brzim napretkom u znanosti i tehnologiji. Jedan od načina kojim pristupamo tom problemu je ranije spomenuta suradnja s fakultetom, a drugi način koji se pokazao ključnim je sudjelovanje na konferencijama.

Nedavno smo probili led kao prva hrvatska firma koja sudjeluje na konferenciji NIPS (Neural Information Processing Systems) – po mnogima najznačajnijem okupljanju stručnjaka u području umjetne inteligencije na svijetu. Dojam nakon prva dva dana bio je da itekako držimo korak s najmoćnijim firmama u tom području te se nadamo da će nam se iduće godine pridružiti još firmi iz Hrvatske. Sudjelovanje na konferencijama smo prihvatili kao sastavni dio našeg napretka, stoga već u travnju idemo i na ICLR (International Conference on Learning Representations), a razmatramo i odlazak na ICDAR (International Conference on Document Analysis and Recognition).

Microblinkov i Photomathov tim na konferenciji

Microblinkov i Photomathov tim na konferenciji Neural Information Processing Systems.

Savjet hrvatskim firmama

Prijelaz tvrtke na strojno učenje nije jednostavan, ali isto tako nije ni opcionalan. Ako mislite da ova nova paradigma nije primjenjiva na vašim problemima, vrlo vjerojatno ste u krivu.

Stručnjaci uspoređuju trenutno razdoblje s onim kada je krenuo internet, a s tom usporedbom će se složiti i naš direktor Damir Sabol, koji je veliki poslovni uspjeh ostvario upravo u tom području osnivanjem Iskona. Brzina prihvaćanja i prilagođavanja strojnom učenju sigurno će odlučivati o sudbini većine kako hrvatskih, tako i svjetskih firmi.

Također bih iskoristio priliku da ukažem na par stvari koje sam primijetio iz razgovora s kolegama iz više hrvatskih firmi. Glavna prepreka u prijelazu na strojno učenje je vrlo rijetko nedostatak motivacije ili znanja inženjera. Velika količina dostupnih materijala za  stjecanje teoretskog znanja dovoljna je za početak, a o motivaciji za rad u području strojnog učenja nije potrebno ni pričati. Ono što gotovo uvijek predstavlja problem je nedovoljna komunikacija unutar firme.

Brz razvoj strojnog učenja u zadnjih par godina ima za posljedicu da upravo studenti i mladi zaposlenici imaju najviše znanja i iskustva u ovom novom području. Kako je za pravi prijelaz na strojno učenje potrebno razumijevanje na razini cijele firme, komunikacija od direktora do studenta je ključna. Moj konkretan savjet onima koji pokušavaju pokrenuti strojno učenje u svojoj firmi je da nađu problem na kojem mogu najlakše dobiti zanimljive rezultate, a zatim to jasno demonstriraju svima ostalima. A općeniti savjet hrvatskim firmama je da ne čekaju po pitanju informiranja i djelovanja na ovu temu.

Komentari

  1. Mirko

    Mirko

    24. 12. 2016. u 15:22 Odgovori

    Uz dužno poštovanje danas se svatko bavi inače zahtjevnim strojnim učenjem jer je kao ‘in’. Zar se u startup industriji baš sve mora isprostituirati. Ostavite bar nešto pravim znalcima i entuzijastima

  2. Mirko

    Mirko

    24. 12. 2016. u 15:30 Odgovori

    I da dodam, njihov produkt Photomath bazira se na tehnologiji prepoznavanja dokumenata. Istu ali značajno moćniju tehnologiju za prepoznavanje nudi Google već par godina i to za male novce. Slučajno poznajem voditelja tog projekta.

    • Matija

      Matija

      2. 1. 2017. u 20:22 Odgovori

      Slobodno isprobajte Google tehnologiju na rukom pisanim jednadžbama. Iz perspektive nekoga tko je napravio iscrpno testiranje i uspoređivanje njihove tehnologije sa našom, moram vam reći da pričate napamet. Ovaj gore komentar pun dužnog poštovanja neću ni komentirat.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Najava

Kako promijeniti tehnologiju ili programski jezik u kojem radite, a da ne izgubite status i ‘perkove’ seniora?

Kako uloviti studente i juniore, to je većina domaćih developerskih agencija i IT tvrtki već apsolvirala te pokazala što znaju i koliko ‘mercha’ mogu osmisliti na nedavnom Job Fairu na FER-u. Ono što je i dalje gotovo nemoguća misija je uloviti dobre seniore.

Kultura 2.0

Dok se mi “zabavljamo” GDPR-om, EU uvodi “porez na linkove” i filtriranje naših sadržaja

20. i 21. lipnja ključni su datumi u donošenju nove direktive o zaštiti autorskih prava EU, koja sa sobom nosi nekoliko spornih stvari - takozvani porez na linkove, gdje bi se mogle plaćati naknade za dijeljenje poveznica na sadržaj, te cenzuriranje interneta uz pomoć filtriranja sadržaja koji korisnici učitavaju.

Analiza

Što dolazak Ericssona u Osijek znači za lokalnu IT scenu?

Ericsson Nikola Tesla uskoro će biti novi članovi osječke IT scene, a njihov dolazak u Slavoniju popraćen je velikim fanfarama sa strane lokalne i državne vlasti. Ipak, hoće li Ericsson "grickati" već etablirane osječke tvrtke i uzimati im zaposlenike i radi li se o nelojalnoj konkurenciji, ili samo o normalnom događaju na tržištu?

Što ste propustili...

Startupi i poslovanje

Hrvatsko-britanski startup za nekretnine zaključio investiciju od 120 tisuća funti

Tržište nekretnina često je viđeno kao posljednja granica koju treba probiti, a upravo prop-tech nastoji doprinijeti toj disrupciji. No budući da su postojeća rješenja uglavnom usko fokusirana, sveobuhvatniji pristup stiže od hrvatsko-britanskog startupa Homible, u kojeg su South Central Ventures i poslovni anđeli uložili 120 tisuća funti.

Tehnologija

Porsche investirao u Rimac Automobile; Mate nam otkriva detalje

Porsche AG od danas je strateški partner Rimac Automobila, a skupa će razvijati tehnologiju koja će biti dijelom električnih automobila budućnosti. Porsche tako postaje vlasnikom udjela od 10% u Rimcu, a domaći proizvođač automobila danas je vrijedan više od milijardu kuna.

Tehnologija

Digitalni dizajn u Hrvatskoj: Sudjelujte u velikom istraživanju o stanju struke!

...a onda pravac na 19. Ux Meetup Zagreb, gdje će se govoriti o umjetnoj inteligenciji i ulozi dizajna.

Mobilno

Moj Vip: Nakon svih korisničkih testiranja, sprinteva i radionica, kako je ispala nova verzija aplikacije?

Vipnet je u svoju novu aplikaciju uložio popriličan trud. Radionice, design sprintevi, korisnička testiranja. Krajnji rezultat? Pa… aplikacija koja je funkcionalna i ne ide mi na živce.

Kultura 2.0

Locastic slavi godinu dana Tinel Meetupa uz predavanje Ryana Townsenda

Locastic je u godinu dana kroz Tinel Meetup splitskoj publici predstavio renomirane govornike iz gotovo svih sfera digitalnog poslovanja, a kruna svega je proslava prvog rođendana Tinela koja će se održati ove srijede u Locasticu, uz predavanje Ryana Townsenda.

Tehnologija

Za sve one koji ne vjeruju, evo kako video igre mogu mijenjati živote

Pokretanje humanitarne organizacije i danas je ogroman rizik, a za Special Effect bio je to iznimno neizvjestan korak s obzirom na stigmu koju svijet video igara nosi - "ma igrice su samo gubitak vremena". Ako ste i vi još skeptici, evo vam jednog idealnog primjera kako gaming djeluje u službi terapije i inkluzije, a da postoji i potpora zajednice svemu tomu, svjedoči i nedavno skupljenih 500 tisuća funti donacija.