Kako smo razvili aplikaciju OmoReader, čitač za osobe s poteškoćama u čitanju

Kako smo razvili aplikaciju OmoReader, čitač za osobe s poteškoćama u čitanju

Stiže insajderska priča iz Locastica o razvoju OmoReadera, aplikacije koja je pored svih uobičajenih funkcionalnosti čitača trebala imati i dodatne mogućnosti prilagođavanja teksta za osobe koje imaju poteškoće s čitanjem.

OmoReader, prvu domaću aplikaciju za osobe koje imaju poteškoća s čitanjem, razvili smo u timu s partnerima iz Omolaba, laboratorija za vizualne komunikacije o kojemu ste već mogli čitati na Netokraciji.

Tijekom čitavog procesa razvijanja aplikacije, upravo zbog činjenice da se radi o projektu koji zaista može poboljšati živote drugih, moramo priznati kako je motivacija tima bila zaista nevjerojatna, posebice jer se u isto vrijeme radi o aplikaciji čiji je koncept izuzetno složen i istovremeno se moralo razmišljati o nekoliko različitih dijelova s kojima se inače nitko od nas ne susreće, a nemaju nužno veze s programiranjem.

U Locasticu i inače radimo na nešto kompleksnijim projektima, ali ovo je prvi put bilo da radimo book reader aplikaciju. I to ne bilo kakvu, već poprilično složen čitačknjiga.

Ako uzmete u obzir da većina postojećih aplikacija podržava jedan ili dva formata, a OmoReader podržava gotovo sve tekstualne formate, rastavljanje na slogove, custom fontove, OCR i analitiku, jasno je kako se ovdje radi o velikom poslu za koji je bilo potrebno dosta vremena i razvoja, ali sretni smo što smo uspjeli i time dokazali da imamo kvalitetan tim na zavidnoj razini, kako u zemlji, tako i u svijetu.

A evo što se krije iza te kvalitete i čitavog procesa…

 

Početak je bio lakši uz rad tri znanstvenice

Naš zadatak bio je razvoj mobilne aplikacije koja je pored svih uobičajenih funkcionalnosti čitača trebala imati i dodatne mogućnosti prilagođavanja teksta, konverzije različitih formata u .epub te OCR-a (optičkog prepoznavanja znakova), a jedan od glavnih i kompliciranijih funkcionalnosti ove aplikacije s kojim smo se susreli je samo rastavljanje riječi na slogove.

Srećom, nismo morali razvijati poseban algoritam za rastavljanje riječi, jer bi to znatno produžilo razvoj aplikacije, već smo na samom početku istraživanja pronašli algoritam koji je rezultat izvornog znanstvenog rada Postupak automatskoga slogovanja temeljem načela najvećeg pristupa i statistika slogova za hrvatski jezik autorica Ane Meštrović i Sande Martinčić-Ipšić s Odjela za informatiku Sveučilišta u Rijeci te Mihaele Matešić s Filozofskog fakulteta Sveučilišta u Rijeci.

Algoritam je, kao što je vidljivo u aplikaciji, odlično odradio svoj dio posla.

Ispod haube

Što se tiče samog čitača, aplikacija je izrađena u Ionic frameworku, koji omogućava izradu hibridnih mobilnih aplikacija u web tehnologijama: HTML, CSS i javascript (Angular 7). Osim toga, važan dio aplikacije baziran je i na epub.js libraryju koji smo znatno prilagodili potrebama aplikacije. OCR je implementiran uz pomoć vanjskog API-ja, dok smo svoju custom analitiku, koja će nam omogućiti daljnje unapređenje aplikacije, izradili uz pomoć Firebasea.

Najveći izazovi prilikom razvoja najprije su se vezali uz formate samih knjiga. Aplikacija je trebala podržavati gotovo sve formate u kojima se elektronske knjige pojavljuju, a budući da bi razvoj funkcionalnosti za svaki od ovih formata značajno odužio razvoj aplikacije, odlučili smo se fokusirati na ePub, a ostale formate podržati konverzijom knjiga iz ostalih formata u ePub.

Koliko muke može zadati algoritam za rastavljanje slogova?

Jedna od najvažnijih funkcionalnosti ove aplikacije je rastavljanje na slogove, što je ujedno bio i najveći problem za riješiti. U početku se algoritam činio kao jednostavan problem (prva pomisao bila je rastavljanje riječi kod samoglasnika), ali se na kraju ispostavilo kako se radi o mnogo težoj zadaći. Prilikom istraživanja shvatili smo da zapravo sami ne možemo definirati točna pravila po kojima napisati algoritam, a razlozi zašto je tomu tako nešto su kompliciraniji.

Ako pokušate rastaviti broj dvanaest na slogove, većina ljudi će vam ispravno odgovoriti, ali ako ih pitate koje su metode i pravila koristili – neće znati. Na nama je bilo da istražimo sva gramatička pravila i smislimo način kako ih implementirati unutar aplikacije. Takve stvari baš i ne možete pronaći “guglanjem”, ali smo, srećom, u to vrijeme naišli na gore spomenuti znanstveni rad, koji je odgovorio na veliki broj naših problema.

Imali smo tu sreću da su nam autorice rada dale dozvolu za njegovo korištenje te smo uspjeli prilagoditi Python algoritam u JavaScript. Funkcionalan algoritam bio je samo prvi korak jer smo morali pronaći način da ga primijenimo na knjigama. ePub format je zapravo neka vrsta .zip datoteke koja se sastoji od HTML, CSS i JavaScript datoteka, poput svakog weba. Bilo je potrebno napraviti algoritam koji će modificirati strukturu HTML-a u knjigama, kako bismo omogućili bojanje slogova i označavanje zrcalnih slova bez da narušimo izvorni dizajn knjige, a koji će uz to biti efikasan i brz.

Poslužite se open source API-jem kad god je to moguće

Također, jedan od izazova s kojima smo se susreli prilikom implementacije bila je i siva linija koja nam omogućava praćenje teksta prilikom čitanja radi lakšeg održavanja koncentracije. Linija je trebala podržavati različite brzine čitanja i zbog toga smo posebnu pažnju morali posvetiti izračunu duljine trajanja linije za svaku pojedinu riječ, kako ona ne bi išla prebrzo ili presporo na toj riječi.

Aplikacija je trebala sadržavati i funkcionalnost optičkog prepoznavanja znakova (OCR). Razvoj ovakvog sustava samog po sebi može potrajati godinu ili više dana, ali na svu sreću naišli smo na open source API koji je već riješio taj problem te smo ga iskoristili. Kod ovako kompleksnih zadataka uvijek je bolje koristiti već dostupno i gotovo rješenje, nego samostalno krenuti njegov u razvoj, pogotovo ako imate definiran fiksni rok za izradu.

Uz podatke o korištenju otvaraju se i mogućnosti nadogradnje

Uz sve značajke koje smo nabrojali, poput rastavljanja slogova, postavki fontova, OCR-a i konverzije, jedna od najbitnijih posebnosti za krajnjeg korisnika i za budući razvoj sigurno je analitika koja prati registrirane korisnike. O tim korisnicima, koji su prijavljeni u svoj račun, prikupljamo podatke o postavkama OmoReadera koje se koriste kako bi kroz analitiku mogli ustanoviti koji fontovi/veličine/razmaci donose najbolje rezultate i kako bi mogli pomoći u daljnjem razvijanju rješenja za osobe s poteškoćama u čitanju.

Razvoj OmoReadera svakako je kontinuiran proces i konstantno ćemo implementirati iskustvo korisnika kroz korištenje aplikacije da bi u konačnici dobili što optimiziraniji proizvod.

11.3.2018. U cilju potpune transparentnosti, moramo napomenuti kako je OmoReader aplikacija intelektualno vlasništvo tvrtke OmoLab, laboratorija za vizualnu komunikaciju dok je agencija Locastic angažirana za tehničku izvedbu aplikacije.

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Društvene mreže

Biste li plaćali za korištenje Facebooka i Instagrama? A YouTubea i X-a?

Nova epizoda Netokracijina podcasta kao da se nije odmaknula od Noći vještica jer strava se nastavlja - big tech ekipa uvodi pretplate na sve strane. No, dogodila se jedna stvar koja nam daje nadu... Elon Musk održao je prvi "all hands" sastanak!

Ekskluzivno

Daytona osigurala 2 milijuna dolara od investitora poput CEO-a Stack Overflowa i Damira Sabola

U najranijoj, pre-seed rundi financiranja, Daytona je osigurala investiciju od čak 2 milijuna dolara, primarno od poznatih američkih i hrvatskih (su)osnivača.

Netokracija Podcast

Ovo je email strategija kojom je Burazin privukao investitore poput direktora Stack Overflowa

U novoj epizodi ulazimo u detalje o: (vjerojatno) najvećoj pre-seed rundi u hrvatski startup; tome kako SAD namjerava kontrolirati AI sustave koji bi mogli napraviti atomsku bombu te zašto osnivača Netokracije Ivana Brezaka Brkana izbacuju iz zagrebačkih kavana?

Što ste propustili

Esport

Kako esport industrija izgleda danas – iz perspektive partnera, sponzora, igrača i regulatora?

Ovoga prosinca u Zagrebu čeka nas prvo izdanje Beyond Esports konferencije koja se, kao što joj i ime kaže, bavi esport industrijom i svemu onome što ju pokreće.

Mobilne aplikacije

Vinare čeka EU regulativa, ali Kovačević i Drmač imaju rješenje: Craft Technology E-etikete!

Tko god je imao doticaja s EU regulativama zna da nisu jednostavne niti ih se smije shvatiti olako. Jedna takva stiže i u svijet vinara, a hrvatski Craft Technology mogao bi im tu biti od velike pomoći.

Tvrtke i poslovanje

LAQO opet u potrazi za najodrživijim tech rješenjima koja će nagraditi s 18 tisuća eura

Nakon uspješnog prvog izdanja s više od 250 prijava, krenule su prijave za drugo izdanje LAQOthona, nagradnog natječaja idejnih tech rješenja na temu održivosti u organizaciji Croatijinog LAQO osiguranja, prvog 100 posto digitalnog osiguranja.

Netokracija Podcast

Hoće li robotaksiji na ulice Zagreba i – kad?

I je li uopće realno očekivati da će se to dogoditi? U ovoj epizodi Netokracijinog podcasta pretresli smo tu vruću temu i to iz svih kutova - tehnološkog, operativnog, financijskog i komunikacijskog.

Tvrtke i poslovanje

10 godina Lean Startup Hrvatska: Ekosustav nekad i danas, što je plan za Smion?

Nakon 10 godina i na desetke radionica, edukacija i događaja Lean Startup Hrvatska postaje Smion te se nastavlja još više fokusirati na razvoj poduzetničkog i inovacijskog ekosustava. U velikom intervjuu, komentiramo desetljeće iza njih, kao i okolnosti na domaćoj sceni nekada i danas.

Analiza

Diskriminira li PlayStation Store Hrvate? Popusta nemamo, euro se tek uveo, a plaćali smo bonovima…

Domaće obožavatelje PlayStation konzole ova godina nije nimalo mazila. Štoviše cijelu godinu obilježio ih je osjećaj "zadnje rupe na svirali" jer sve do sredine studenog nisu mogli kupovati karticama. Zašto? PlayStation Store 11 mjeseci nije prešao na euro niti je dvojno iskazivao cijene...