Mali hrvatski jezik više nije problem. Doktori u Hrvatskoj već diktiraju svoje nalaze i emailove

Mali hrvatski jezik više nije problem. Doktori u Hrvatskoj već diktiraju svoje nalaze i emailove

Dominantan jezik tehnologije bio je i ostao engleski. Srećom, postoje tvrtke poput Newton Technologiesa koje svojim rješenjima približavaju mogućnosti inovacija i manjim narodima. Evo kako su domaći liječnici i odvjetnici uz njihovu pomoć počeli diktirati svoje nalaze i rješenja na hrvatskom...

Eksplozivni tehnološki napredak zadnjih desetljeća uvelike je bio povezan s dijelovima svijeta u kojima se najviše govori engleski jezik. Zahvaljujući tome, taj je jezik – kojim se inače služi 1,5 milijarda ljudi diljem svijeta – danas dominantan u brojnim proizvodima i uslugama te je ključan za njihovo razumijevanje i korištenje.

Manji jezici poput hrvatskog osuđeni su stoga na stalno hvatanje priključka, putem lokalizacije i na druge načine, a zbog razmjerno malog broja govornika često je i manje isplativo razvijati aplikacije, servise i proizvode koji se temelje na njima.

Ipak, ima i primjera kako tomu ne mora biti tako. Jedan od njih je ekipa iz Newton Technologiesa koja se odlučila pozabaviti softverom za oko 315 milijuna ljudi sa slavenskog govornog područja. Njihova rješenja danas koriste radiolozi, epidemiolozi, kardiolozi, javni službenici i odvjetnici…

Diktiranje na dvadesetak jezika

Tvrtka Newton Technologies pokrenuta je 2008. godine s idejom da klijentima ponudi implementaciju glasovnih tehnologija na ukupno 20-ak jezika, uglavnom onih u srednjoj i zapadnoj Europi. Osam godina kasnije u Zagrebu je osnovana Newton Technologies Adria (NTA), kako bi se bavila razvojem i prilagodbom tehnologija za jezike s područja jugoistočne Europe. Kako je Netokraciji rekao Marko Poljak, glavni izvršni direktor NTA:

Misao vodilja je bila koristiti ekspertizu iz područja tehnologija prijenosa govora u tekst za prilagodbu rješenja krajnjih korisnicima, kako bi uklonili potrebu za tipkanjem dokumentacije.

Krume Ivanovski

U njihovom timu zaduženom za naš dio svijeta nalazi se tridesetak ljudi, što IT stručnjaka, što lingvista i ljudi koji rade na edukaciji korisnika. Posao im je, prema Poljakovoj ocjeni, daleko jednostavniji nego prije, dobrim dijelom i zbog eksplozivnog uspona generativne umjetne inteligencije zadnjih mjeseci.

Samo reci, i zapisat će se… bio to email ili formular

Našu su pozornost privukli njihovi proizvodi namijenjeni zdravstvu i pravosuđu, koji olakšavaju dokumentiranje rada izravnim diktiranjem. Kako nam je to Poljak opisao:

Zamislite da jednostavno pokrenete program, odredite polje za unos teksta, uzmete mikrofon i počnete diktirati. Voilà!

Program ispisuje tekst u realnom vremenu, bilo da se radi o polju unutar bolničkog informacijskog sustava, stvaranju dokumenta na računalu ili slanju e-maila. Program piše tamo gdje kliknete mišem, što znači da vam više ne treba čarobni štapić za brzo obavljanje posla.

Engleski jezik su svladali u samo dva tjedna, ali s hrvatskim i ostalim slavenskim jezicima nije išlo tako jednostavno. Borba je počela 2006. godine i još traje jer i danas stalno usavršavaju proizvode koji ih koriste.

Engleski jezik su svladali u samo dva tjedna, ali s hrvatskim i ostalim slavenskim jezicima nije išlo tako jednostavno.

Ubrzavaju rad liječnika za 55 do 85 %

Još 2016. ponudili su softver Newton Dictate za transkripciju u realnom vremenu, a prvi rječnik – zbirku stručnih izraza koje se koristi u određenom području i konteksta u kojima se mogu naći – bio je namijenjen radiolozima.

Danas uz to nude i opći medicinski rječnik, kojeg mogu koristiti i ostale struke.

Newton Dictate, navodi Poljak, koristi na stotine liječnika u javnim i privatnim ustanovama. Među ustanovama u kojima je prisutan su, između ostalih, Klinika za dječje bolesti Zagreb, Opća bolnica u Puli, Klinička bolnica Merkur, Poliklinika Sveti Rok…

Prema podacima koje je predočio Poljak, njihov softver, ovisno specijalizaciji, ubrzava rad liječnika za 55 do 85 posto.

Čak smo radili testove na slijepo s liječnicima koji nikada nisu vidjeli sustav. S prvim nalazom kreiranim glasom došli su do 51 posto ubrzanja u odnosu na tipkanje.

Prostora za poboljšanje vide u daljnjoj specifičnoj prilagodbi rječnika unutar sustava, ali i u prilagodbi glasovnih naredbi unutar programa, s ciljem dobivanja teksta koji je točno prepisan, ali ujedno i formatiran na očekivani način.

Zasad u korištenju Newtone Dictatea prednjače radiolozi, patolozi, citolozi, endokrinolozi, ortopedi, kardiolozi, liječnici nuklearne medicine, pedijatri…

Za pravosuđe su pripremili sličan proizvod, uz pripadajući pravni rječnik, koji je u uporabi od 2018. godine. Za njegovu je izradu bilo potrebno oko šest mjeseci rada.

Sve se ažurira redovito podacima relevantnim za usavršavanje rječnika. Već smo prešli i 40 razvojnih instanci pojedinih specijaliziranih verzija.

Za svaku novu inačicu rječnika – dodavanje novih riječi i konteksta – treba računati na dodatnih 2-3 mjeseca rada. Pravni rječnik je sad na 39. verziji.

Modeli neuronskih mreža

Pri razvoju najveći je izazov bio uskladiti kompleksnosti jezika, očekivanja korisnika i ograničenja tehnologije.

Slavenske jezike karakterizira bogata morfologija (općenito imaju sedam padeža i tri gramatička roda) s prefiksima i sufiksima, uključujući flektivne nastavke. Glavni izazov u izradi rješenja je ispuniti očekivanja korisnika: ponuditi točnost prijepisa i pravilno formatiranje teksta. Primjerice, učiniti da program ispisuje različite formate ovisno o kontekstu izgovorenog.

U cijeli proces razvoja jezične komponente sustava za transkripciju jezika uključena je umjetna inteligencija.

Tijekom razvoja koristili smo modele duboke neuronske mreže i e2e model, nova generacija modela u kojoj neuronska mreža izravno povezuje govor s tekstom.

Naše sestrinske tvrtke – Presscut i Kliping – djeluju u domeni “media intelligence” i imaju riznicu tekstualnih, audio i video materijala koji nam pomažu u osvajanju novih jezika.

Što im je dostupna veća količina podataka to je bolji razvoj tehnologija za taj jezik, ističe Poljak. Kako bi razvili specijalizirane rječnike, zato koriste tekstove slične onima koje će korisnici diktirati, nastojeći osigurati prepoznavanje konteksta i što preciznije pretvaranje govora u tekst.

Za transkripciju intervjua i rasprava tu je Beey

 

Odnedavno je na tržištu i njihova platforma za transkripciju Beey, koja služi za olakšavanje procesa transkripcije te prijepis audio i video snimki. Uz pomoć Beeyja audio snimka se automatski transkribira. Nakon toga je dostupna za prepravke, s time da više ljudi može raditi na istoj snimci. Uz to, Beey sam detektira govornike i razdvaja tekst, a ugrađena je i funkcija provjere pravopisa, kako bi lakše uočili potencijalnu pogrešku.

Cijeli transkribirani tekst je pretraživ, a – kako je audio povezan s prijepisom – u dugoj audio snimci ste preko tekstualne pretrage odmah pozicionirani na mjestu koje vas zanima i moguće je vrlo brzo naći dio snimke na koji želite obratiti posebnu pozornosti.

To je rješenje koje se sve više koristi i u medijskoj industriji, za titlovanje i prijevode titlova, ali i za pravosudna tijela i transkripciju rasprava.

Razvoj Beeyja se nastavlja, a u to je odnedavno uključen i sveprisutni ChatGPT.

Povezali smo ChatGPT s transkriptima za sumarizaciju teksta, što nam je otvorilo sasvim nove mogućnosti za razumijevanje sadržaja.

Pet puta veći broj korisnika do 2025.

Newton Dictate u ponudi je uglavnom na bazi mjesečne pretplate po glasovnom profilu (korisniku), dok Beey pretežito nude na bazi naplate jednokratnog korištenja.

Različite funkcionalnosti i usluge također utječu na cijenu.

Tržišta na koja smo fokusirani se nalaze u regiji Adria regiji, gdje trenutno imamo nešto više od 1.300 korisnika sustava Newton Dictate i nekoliko desetaka Beey sustava.

Plan je da do 2025. godine imamo više od 6.000 korisnika sustava Newton Dictate, a da Beey bude integriran sa svim medijima i neizostavan alat za sve zapisnike i sastanke. 

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Vodič

Morate podnijeti zahtjev za novu osobnu iskaznicu? Evo kako izbjeći gužvu na šalteru

Završetkom pandemije došao je službeni kraj maskama, ali i mnogim identifikacijskim dokumentima pa tako i osobnim iskaznicama bez kojih ne možete boraviti u Hrvatskoj. Ovo znači samo jedno... ogromni redovi na šalterima.

Web 3

Belma Gutlić: “Fokus s cijena kriptovaluta treba prebaciti na tehnologiju koja kriptovalute omogućava”

Danas se možemo pohvaliti da na našoj maloj sceni ne nedostaje konferencija vezanih uz blockchain i kriptovalute. Ipak, postoji jedan krovni naziv kojem se nitko dosad nije posvetio na jednak način, a koji možda zaslužuje i najviše pažnje.

Novost

800.000 eura investicije za Turneo hrvatskih osnivača koji želi digitalizirati globalno tržište turističkih izleta

Za svoju B2B platformu za distribuciju izleta prikupili su 800.000 eura pre-seed investicije. Kažu da im je navjeća konkurencija olovka i papir, a s njom se bore brzom implementacijom, lakim korištenjem i - umjetnom inteligencijom.

Što ste propustili

Intervju

Končar D&ST nakon revizije prema Mamforce standardu učvrstio zdravu i inkluzivnu organizacijsku kulturu

Glavne korporativne vrijednosti u tvrtki Končar D&ST su kontinuirana briga o zaposlenicima, uključivost, društvena odgovornost i ekološka održivost, a sada im se polaže sve sustavnija i promišljenija pažnja.

Tvrtke i poslovanje

Micro-Link: Poslodavac jednakih mogućnosti mora imati temelje u kulturi pravičnosti, raznolikosti i uključenosti

Micro-Linkova "formula" zapravo je jednostavna: kako bi kao tvrtka bili produktivni i uspješni, moraju imati zdrave, odmorne i sretne zaposlenike.

Video

Metaverse nije mrtav! Samo je “skriven” zbog investitora

Je li metaverse živ ili mrtav - pitanje je sad. Ako pitate svjetske medije, mnogi su već izdali osmrtnice metaversu. No, možda su malo trčali pred rudo.

Mobilne aplikacije

Predstavljena je aplikacija “Moj ZET” za kupovinu karata javnog prijevoza putem mobitela

Aplikacija je trenutno dostupna za Android uređaje, dok će za iOS biti za nekoliko dana.

Tehnologija

STEM avantura osnovnoškolskih robotičara iz Prigorja Brdovečkog dovela ih je do Maroka i nagrada

Programiranje LEGO robota, razvijanje solarnog punjača mobilnih telefona, natjecanje s drugim ljubiteljima STEM-a, osvajanje medalja i putovanje na drugi kontinent. Malo je reći kako su osnovnoškolci iz Tima Regoč imali uzbudljivu STEM avanturu na kojoj su proputovali preko 2500 kilometara!

Intervju

20 godina WordPressa: Prednosti i mane (zajednice) sustava na kojem počiva skoro 50% weba

Možemo li bolje proslaviti 20 godina WordPressa od detaljne analize u kojoj raspravljamo njegove uspone i padove, prednosti i mane, viziju za budućnost, ali i trenutne goreće probleme u WP ekosustavu...