Microblink: Kako uz strojno učenje držimo korak s tehnološkim napretkom

Kako uz strojno učenje u Microblinku držimo korak s tehnološkim napretkom

Strojno učenje je u zadnjih nekoliko godina pridobilo veliku pozornost akademske zajednice, industrije te javnosti općenito. Razlog tome je opravdan, algoritmi su po prvi puta u povijesti počeli rješavati određene probleme bolje od čovjeka. Iako se to područje razvija još od pedesetih godina, potrebna je bila kombinacija napretka u hardveru i dostupnosti velike količine podataka kako bi se došlo do priželjkivanih rezultata. Danas strojno učenje daje 'state-of-the-art' rezultate na većini problema u području računalnog vida, a velikom brzinom ulazi i u ostala područja računarstva.

NIPS Microblink

No, što to konkretno znači za jednu tvrtku? Mišljenja sam da većina ne shvaća značaj nedavnih promjena u ovom području. Strojno učenje nije samo još jedan od algoritama koji bi inženjeri trebali uključiti u svoja rješenja, to je preokret u načinu rješavanja problema u računarstvu općenito. Da bi se jedna firma mogla pohvaliti da zasniva svoju tehnologiju na strojnom učenju, potrebna je promjena u načinu poslovanja te razvijanja i razmišljanja svih zaposlenika. Demonstrirat ću vam to na našem primjeru u Microblinku, gdje smo u potpunosti prešli na strojno učenje vrlo rano u odnosu na našu konkurenciju.

Microblink razvija visoko optimizirana rješenja računalnog vida za mobilne uređaje, s naglaskom na tzv. OCR tehnologiju. Glavne odlike naše tehnologije koje klijenti od početka hvale su izrazito brzo izvođenje te velika preciznost i pouzdanost naših algoritama. Dobra rješenja rezultat su konstantnog akademskog istraživanja, beskompromisnog stava prema optimizaciji i, prije svega, odlične komunikacije unutar firme – od direktora do studenta na ljetnoj praksi.

Upravo ta razina komunikacije pokazala se ključnom za brzo i uspješno uvođenje strojnog učenja. Sama ideja i inicijalna demonstracija nove paradigme proizašla je iz diplomskog rada studenta, no za promjenu bilo je potrebno razumijevanje na razini cijele firme. Razvijanje postojeće tehnologije računalnog vida obustavilo se na skoro dvije godine kako bi se uložili resursi i vrijeme u nešto što se tada činilo poprilično riskantno. 

Sve je u podacima

U klasičnom pristupu razvijanja algoritama bez učenja inženjer preuzima na sebe donošenje svih odluka prilikom implementacije rješenja. U strojnom učenju te odluke donose se automatizirano, odnosno uče se na podacima. Stoga uspješnost takvog algoritma izravno ovisi o količini i kvaliteti podataka. Koliko dobro pokrijete domenu problema sa svojim podacima, toliko dobro će se vaš algoritam ponašati.

Ono što se iz našeg iskustva nije pokazalo intuitivno je količina podataka koja se podrazumijeva kada se kaže “puno”. Deset tisuća u strojnom učenju nije velik broj, radi se o potrebi za podacima u milijunskim iznosima. Prikupljanje, pohranjivanje i upravljanje tolikom količinom podataka postaje zaseban izazov, zbog čega Microblink ima poseban tim koji se bavi samo time.

Sustav za učenje

Zahvaljujući javno dostupnim alatima za učenje poput TensorFlowa (koji i sami koristimo), razvijanje prototipa rješenja strojnog učenja je relativno jednostavno. Dojam koji općenito ostavlja nova paradigma je da se radi o plug-n-play pristupu rješavanja problema, odnosno da nije potrebno puno truda i razumijevanja za dobivanje dobrog rješenja. Taj dojam se znatno mijenja prilikom rada na konkretnim problemima u industriji gdje su potrebni state-of-the-art rezultati uz velika ograničenja na kompleksnosti modela.

Kod razvijanja takvih rješenja potreban je detaljan uvid u proces učenja, ponašanje naučenih modela, kao i svojstva podataka na kojima se uči. Stoga se u Microblinku veliki dio vremena i resursa ulaže upravo u razvijanje sustava za učenje koji nam to omogućuje. Neke odlike dosad razvijenog sustava su: mogućnost prikupljanja i upravljanja ogromnim količinama podataka, brzo učenje na GPU serverima čiji broj konstantno raste te detaljna analiza naučenih modela po pitanju preciznosti, ali i performansi na mobilnim uređajima. Konačni cilj je da strojno učenje postane standardni alat unutar cijele firme kako bi se primijenio i izvan naše core tehnologije.

Optimiziranje za mobilne uređaje

Jedan od problema strojnog učenja je da su naučeni modeli koji daju dobre rezultate često preveliki za korištenje na mobilnim uređajima. Stoga većina rješenja u industriji ima neki oblik izvođenja na serveru kako bi se što brže došlo do rezultata modela. Naravno, takav pristup ima svoje mane, kao što je potreba za internetskom vezom i nemogućnost izvođenja u stvarnom vremenu. S obzirom na prethodno spomenuto inzistiranje Microblinka po pitanju performansi, vrlo rano smo počeli s razvijanjem našeg optimiziranog izvođača naučenih modela na mobilnim uređajima. Danas imamo cijeli tim ljudi koji radi na njegovom razvoju te se možemo pohvaliti s dvostruko bržim izvođenjem naših modela u odnosu na Googleov TensorFlow.

Naš najveći projekt dosad je prepoznavanje rukom pisanih jednadžbi za Photomath, u sklopu kojeg smo razvili po našim saznanjima prvi na svijetu u potpunosti učen model za OCR koji radi u stvarnom vremenu na mobilnom uređaju.

Photomath app instantly scans and solves math problems right from your notebook.

Znanost i edukacija

Ono na čemu bi Hrvatska sigurno trebala poraditi je mjera u kojoj industrija surađuje s fakultetima. Iz našeg iskustva nemoguće je razvijati konkurentnu visoku tehnologiju bez konstantnog akademskog istraživanja. Stoga je velik dio Microblinkovih projekata organiziran u suradnji s određenim zavodima na FER-u, a nastojimo proširiti tu suradnju i na ostale fakultete kojima smo u mogućnosti ponuditi konkretne i studentima zanimljive projekte.

Strojno učenje se u praksi zna poprilično razlikovati od teorije, stoga je naš najveći doprinos studentima upravo iskustvo iz industrije. Kako bi što brže to iskustvo prenijeli, ali i popunili eventualne rupe u znanju, naši inženjeri vode redovitu internu edukaciju za studente.

Na taj način studenti u Microblinku vrlo brzo steknu dovoljnu razinu znanja i iskustva za rad na ozbiljnim i izazovnim problemima u industriji.

Naš je najveći izazov, a vjerujemo i za ostale tehnološke firme koje razvijaju konkurentna rješenja, držanje koraka s izrazito brzim napretkom u znanosti i tehnologiji. Jedan od načina kojim pristupamo tom problemu je ranije spomenuta suradnja s fakultetom, a drugi način koji se pokazao ključnim je sudjelovanje na konferencijama.

Nedavno smo probili led kao prva hrvatska firma koja sudjeluje na konferenciji NIPS (Neural Information Processing Systems) – po mnogima najznačajnijem okupljanju stručnjaka u području umjetne inteligencije na svijetu. Dojam nakon prva dva dana bio je da itekako držimo korak s najmoćnijim firmama u tom području te se nadamo da će nam se iduće godine pridružiti još firmi iz Hrvatske. Sudjelovanje na konferencijama smo prihvatili kao sastavni dio našeg napretka, stoga već u travnju idemo i na ICLR (International Conference on Learning Representations), a razmatramo i odlazak na ICDAR (International Conference on Document Analysis and Recognition).

Microblinkov i Photomathov tim na konferenciji
Microblinkov i Photomathov tim na konferenciji Neural Information Processing Systems.

Savjet hrvatskim firmama

Prijelaz tvrtke na strojno učenje nije jednostavan, ali isto tako nije ni opcionalan. Ako mislite da ova nova paradigma nije primjenjiva na vašim problemima, vrlo vjerojatno ste u krivu.

Stručnjaci uspoređuju trenutno razdoblje s onim kada je krenuo internet, a s tom usporedbom će se složiti i naš direktor Damir Sabol, koji je veliki poslovni uspjeh ostvario upravo u tom području osnivanjem Iskona. Brzina prihvaćanja i prilagođavanja strojnom učenju sigurno će odlučivati o sudbini većine kako hrvatskih, tako i svjetskih firmi.

Također bih iskoristio priliku da ukažem na par stvari koje sam primijetio iz razgovora s kolegama iz više hrvatskih firmi. Glavna prepreka u prijelazu na strojno učenje je vrlo rijetko nedostatak motivacije ili znanja inženjera. Velika količina dostupnih materijala za  stjecanje teoretskog znanja dovoljna je za početak, a o motivaciji za rad u području strojnog učenja nije potrebno ni pričati. Ono što gotovo uvijek predstavlja problem je nedovoljna komunikacija unutar firme.

Brz razvoj strojnog učenja u zadnjih par godina ima za posljedicu da upravo studenti i mladi zaposlenici imaju najviše znanja i iskustva u ovom novom području. Kako je za pravi prijelaz na strojno učenje potrebno razumijevanje na razini cijele firme, komunikacija od direktora do studenta je ključna. Moj konkretan savjet onima koji pokušavaju pokrenuti strojno učenje u svojoj firmi je da nađu problem na kojem mogu najlakše dobiti zanimljive rezultate, a zatim to jasno demonstriraju svima ostalima. A općeniti savjet hrvatskim firmama je da ne čekaju po pitanju informiranja i djelovanja na ovu temu.

ponuda

Komentari

  1. Mirko

    Mirko

    24. 12. 2016. u 3:22 pm Odgovori

    Uz dužno poštovanje danas se svatko bavi inače zahtjevnim strojnim učenjem jer je kao ‘in’. Zar se u startup industriji baš sve mora isprostituirati. Ostavite bar nešto pravim znalcima i entuzijastima

  2. Mirko

    Mirko

    24. 12. 2016. u 3:30 pm Odgovori

    I da dodam, njihov produkt Photomath bazira se na tehnologiji prepoznavanja dokumenata. Istu ali značajno moćniju tehnologiju za prepoznavanje nudi Google već par godina i to za male novce. Slučajno poznajem voditelja tog projekta.

    • Matija

      Matija

      02. 01. 2017. u 8:22 pm Odgovori

      Slobodno isprobajte Google tehnologiju na rukom pisanim jednadžbama. Iz perspektive nekoga tko je napravio iscrpno testiranje i uspoređivanje njihove tehnologije sa našom, moram vam reći da pričate napamet. Ovaj gore komentar pun dužnog poštovanja neću ni komentirat.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Analiza

Telekom Bankarstvo: Zabi prosječna bankarska aplikacija, HT-u dodatan izvor prihoda

Telekom bankarstvo Hrvatskog telekoma i Zagrebačke banke ne pruža kvalitetnije korisničko iskustvo ni od hrvatskih konkurenata ni od Revoluta, ali najavljuje agresivnu marketinšku kampanju kakvu prosječna banka ne bi pokrenula.

Startupi i poslovanje

Ne uništavaju paušalni obrti IT industriju, već ogromna davanja na plaće

O problematici paušalnih obrta u IT industriji već se dugo govori tiho, a od ovog vikenda i glasno. No čini se da dobar dio rasprave, koja je buknula preko vikenda, ali i budućih poreznih promjena, koje nas očekuju iduće godine, idu u krivom smjeru - prema jačem oporezovanju samostalnog rada, a ne rasterećenju nesamostalnog, odnosno plaća.

Startupi i poslovanje

Fil Rouge Capital ulaže 9.225.000 kuna u akceleraciju 24 startupa u Hrvatskoj

Fil Rouge Capital odabrao je svoju prvu generaciju startupa za akceleraciju. Svaki od 24 odabrana tima osigurali su seed investiciju od 50 tisuća eura što ovu rundu čini najbrojnijom investicijom u startupe u Hrvatskoj.

Što ste propustili

Internet marketing

Sedmi SoMo Borac s 27 velikih i malih pobjednika

Sa 7. SoMo Borcem zaključen je 12. Weekend Media Festival, a nagrade za najbolje digitalne projekte i kampanje otišle su na razne strane regije.

Internet marketing

Brend Hrvatske kao turističke destinacije nije posao (samo) za državu

Evolucija turizma koja prati razvoj tehnologije donosi niz prilika za rast, no kompleksnost koju donosi digital zahtijeva uključenje komunikacijskih i marketinških stručnjaka u sam strateški proces. Kako ih uključiti saznali smo od turističkog maga, Eulogia Bordasa.

Startupi i poslovanje

Poznati su finalisti šestog izdanja programa Moj Zaba Start

Trideset finalsita šeste godine natječaja Moj Zaba Start poznato je javnosti, a neki od njih će podijeliti gotovo milijun kuna financijskih potpora u tri područja.

Tehnologija

Manje kupujemo aute, ali više romobile. Rješenje? Mercedes električni romobil!

Mercedes je potiho ušao na tržište električnih romobila, a uskoro ćemo na njima možda vidjeti i lokalne "igrače" koji čim sjednu az stol u kafiću bacaju ključ Mercedesa na stol.

Internet marketing

Kovačević, Vrdoljak, Ackermann i Brkan na WMF-u otkrivaju zadnjih 10 godina digitalnog marketinga

Kako je izgledao digitalni sektor prije deset godina i kako se u njemu dan danas snalaze neki od najpoznatijih digitalaca saznat ćemo ove subote na Weekend Media Festivalu.

Startupi i poslovanje

Hubbig Dragane Lipovac kreće u nove pobjede s milijunskom investicijom i novom savjetnicom

Bili vi mali ili veliki uvoznik, naručivali iz Kine ili SAD-a, Hubbig vam može olakšati život, a da to ovom mladom startupu ide dobro potvrdila je i nedavna milijunska investicija koju je orkestrirala Monika Mikac, bivša operativna direktorica u Rimac Automobilima.