Hašek postao Ispravi.me za još bolje i brže ispravljanje pravopisnih greški

Infobip ❤️ Netokracijašto akvizicija znači za vas - i nas?

Legendarni Hašek postao Ispravi.me za još bolje i brže ispravljanje pravopisnih greški

Ako pišete bilo kakve tekstove na hrvatskom jeziku, vjerojatno ste ih nekom prilikom “provukli” kroz Hašek - ili ga možda čak i redovno koristite. Ova aplikacija za provjeru pravopisa jedna je od najstarijih domaćih internetskih usluga, a došlo je vrijeme i da zaodjene novo ruho. Ispravi.me sada još revnije ispravlja naše pravopisne greške, ali i još jednu - činjenicu da nikad nismo znali je li riječ o Hašeku, Hasčeku, Haščeku…

ispravi-me

Znate li koje su najčešće pogreške korisnika Hašeka u prošloj godini? Brzopleto pišemo “nebi” umjesto “ne bi”, “tiće” umjesto “tiče”, “riješenje” umjesto “rješenje”, a nerijetko se provuče i tipfeler u riječi pregled (preged). Dio je to informacija koje se nalaze na novoj web stranici alata za provjeru pravopisa koji sad ima i novo ime – Ispravi.me.

Projekt postoji već 20 godina, a iako je na njemu do sad radilo dvadesetak studenata Fakulteta elektrotehnike i računarstva u sklopu diplomskih i završnih radova, na njemu zapravo konstantno radi “jedna i pol osoba” – prof. Šandor Dembitz, koji je od 1. listopada u mirovini, i dalje svaki dan provodi za računalom i uči Hašeka nove riječi i daje mu nove funkcionalnosti, a uz njega na projektu, ovisno o drugim obvezama radi i prof. Gordan Gledec, prodekan za znanost na FER-u. Tu je i autor korisničkog sučelja, student Ivan Srdić, dok je stranicu dizajnirao Tomislav Korman.

Do sada dostupne dvije verzije Hašeka – i jedna nikad objavljena

Za razgovor smo ulovili upravo onih “pol” čovjeka koji radi na projektu, Gordana Gledeca, koji je spremno naveo glavne razlike između dosadašnjih verzija Hašeka, a spomenuo i neke koje javnost nije imala ni prilike vidjeti. Tako je, primjerice, na Ispravi.me kod jezgre isti kao u prethodnoj verziji, ali razlika je u sučelju i u formatu odgovora koji dostavlja server. Ranije su rezultati obrade išli u XML-u, sad se koristi JSON, dodaje.

Stari Hašek, prva davna verzija, samo je označavao greške, ali ga je svejedno koristilo oko 40 % korisnika. Druga je verzija nešto mlađa, davala je ispravke preko padajućeg izbornika i to je bila jedina “službena” verzija cijelo vrijeme dostupna na hascheck.tel.fer.hr. Nikad javno predstavljena verzija /v2 stajala je na serveru kao rezultat diplomskog rada jednog studenta, ali nikad nije dočekala “službenu” objavu iz raznih razloga. Također, s imenom je uvijek bilo problema jer korisnici nisu znali je li u pitanju Hašek, Haček, Hasček, a bilo je i čudnovatijih varijanti izgovora imena. 🙂

Druga verzija Hašeka, nastala nakon stare - postojala je i još jedna, nikad objavljena.
Još prije dva dana bile su dostupne dvije starije verzije Hašeka, sad sve preusmjeravaju na Ispravi.me. Postojala je i još jedna inačica aplikacije, ali nikad nije objavljena.

Tu je i novi hardver, odnosno mnogo jači server, zbog čega je sada vrijeme obrade teksta upola kraće, a nabavljen je i razvojni poslužitelj pa se sva istraživanja rade na njemu, što znači da je javni server sad namijenjen samo korisnicima, nastavlja. Na tom razvojnom poslužitelju radi se obrada n-grama koji su podloga za kontekstualno ispravljanje teksta.

Sam pogonski mehanizam je rađen kombinacijom Unixovih shell skripti – ostavština ranih osamdesetih i devedesetih kad je sustav razvijan – kasnije su samo dodavane nove funkcionalnosti i mogućnosti (nuđenje ispravaka, elementi kontekstualne provjere i slično). Na web-serveru je između korisnika i pogonskog mehanizma Perl – opet iz povijesnih razloga. Radimo na rewriteu jezgre, ali je teško reći kad će taj posao biti gotov.

Za sam informativni dio web stranice korišten je WordPress s kojim Gledec ima pozitivna iskustva, a odabran je jer bi, kako kaže, FER-ov CMS Quilt za te potrebe bio overkill.

Ugovori s većim korisnicima

Hašek, odnosno Ispravi.me, ima i API, za koji se vežu redakcije određenih novinskih kuća s kojima FER ima ugovor. Naime, API je namijenjen upravo takvim sustavima koji se žele spajati izravno iz svog CMS-a, preko svog sučelja.

Od usluga koje će ga koristiti tu je npr. dodatak za preglednike koji će omogućiti provjeru teksta za bilo koje editabilno polje na bilo kojoj web-stranici (zasad razvijen za Chrome), a izrađena je i probna verzija plugina za Microsoft Word koji u Word unosi pošteni spellchecker. Nad našim API-jem Calyx d.o.o. je napravio dodatak za Google Docs, no nažalost koristi ga uglavnom američka publika za provjeru teksta na engleskom. Ako se to uskoro ne promijeni, morat ćemo razmisliti o ograničenju, jer se naši resursi troše nenamjenski.

Primjer teksta kojim se dokazuje prednost Hašeka, odnosno Ispravi.me, nad uslugom koju, primjerice, nudi Word.
Primjer teksta kojim se dokazuje prednost Hašeka, odnosno Ispravi.me, nad uslugom ispravljanja koju, primjerice, nudi Word.

ograničenja u korištenju usluge ima – korištenje je slobodno za pripadnike akademske zajednice i privatne korisnike koji uslugu ne koriste u profesionalne svrhe, dok ostali mogu sklopiti ugovor s FER-om.

U prvih 20 godina država je za razvoj usluge izdvojila ravno 0 kuna, ako ne uzmemo u obzir plaće zaposlenicima FER-a koji su radili na razvoju. Vidjet ćemo u kojem smjeru će se usluga razvijati, kako će se ponašati korisnici, već imamo ograničenja za profesionalne korisnike koji na obradu predaju znatno natprosječnu količinu teksta – to troši resurse na kojima usluga počiva, ali i vrijeme prof. Dembitza koji Hašeka uči novim riječima, uglavnom iz imenskog fonda. S

nekima od “velikih” korisnika sklopili smo ugovor iz kojeg uspijevamo financirati razvoj usluge. Veliku nam pomoć predstavlja potpora iz Agrokora, koji je pokrovitelj usluge, koji je među prvim velikim kompanijama prepoznao važnost ispravnog pisanja, a posebno stvaranja podatkovne podloge nužne za smanjenje znatnog zaostatka hrvatskoga jezika u jezičnim tehnologijama.

Zašto .me, a ne .hr?

Za kraj, zanimljivo je što je za novu verziju usluge odabrana domena .me – a još više jer je Gledec predsjednik DNS povjerenstva, odnosno povjerenstva za .hr domenu.

Ideja za Ispravi.me mi je sinula prije skoro dvije godine usred noći pa sam otišao provjeriti je li slobodna i iznenadio se kad je bila – odmah sam je kupio. Logična je – posebno jer je ljude zbunjivalo dosadašnje ime. Kao predsjednik DNS povjerenstva, nemam problem s tim. Ispravi.hr nema “ono nešto”. A i previše bi koštalo. 🙂

Hašek je u posljednjih mjesec dana posjetilo 24.000 korisnika uz 84.000 sesija, a upravo je to glavna motivacija za nastavak rada na ovom projektu – tisuće ljudi koji uslugu svakodnevno koriste, ali i poruke onih koji tvrde da bez nje više ne bi mogli ni raditi.

Trebamo li spominjati da je i ovaj članak pregledao Hašek, odnosno… Ispravi.me? 😉

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Komentari

  1. pennypoe

    pennypoe

    12. 06. 2019. u 10:58 am Odgovori

    Može li se znati razlog zbog čega stranica (rijetko) ne želi provjeriti tekst?

    Greška:
    Provjera teksta nije moguća. Molimo pogledajte Uvjete korištenja.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Novost

Što se događa u tech industriji? Masovna otpuštanja, kripto-burza propala preko noći, a tek Twitter…

Malo je reći kako ovaj tjedan nije bio dobar za IT industriju. Zapravo, poprilično je kaotičan i čini se kako stabilnost neće doći uskoro...

Društvene mreže

Gdje ćemo se družiti i raspravljati ako propadne Twitter?

Bilo da vas brine koliko dugo će još Twitter funkcionirati (što nije čudo s obzirom na svakodnevne vijesti o zbunjujućim poslovnim potezima) ili da ne želite biti dio Muskovog Twittera, evo što se nudi od alternativa.

Programiranje

Miro Jurić već 23 godine radi u Microsoftu u Redmondu, a nama je otkrio tajne uspješnog developer managmenta

Kročiti u sjedište operativnog sustava kojeg koristiš cijeli svoj život, kojeg poznaješ po pozadini predivne livade i oblaka, stvarno je nezaboravno iskustvo. Ipak, ono što te još više iznenadi je razgovor s Hrvatom koji tamo radi 23 godine i koji je s tobom podijelio sve što zna o developer managementu.

Što ste propustili

Tehnologija

30. godina od prvog SMS-a: Kako je privatni kanal postao alat za B2C komunikaciju

Na 30. obljetnicu SMS-a prolazimo specifičnosti SMS kanala komunikacije koji je preživio dolazak interneta, pametnih telefona i messaging aplikacija, a s Infobipovim stručnjacima otkrivamo i zbog čega je na kraju opstao.

Tehnologija

Panika, izgubljeni podaci, ransomware: Kako spriječiti i liječiti sigurnosne incidente?

Napadi hakera, malware i ransomware ne događaju se nekom drugom. Kako takve napade spriječiti i što učiniti ako se ipak dogode - s tehničke, ali i ljudske strane, saznali smo od konzultanta za cybersigurnost Tomislava Poljaka.

Intervju

Zoran Božičević: Zdrav tim “tajna” je dobrog developmenta

Zanimljivi projekti i dobra plaća nužan su uvjet zadovoljstva developera, međutim, posebno je umijeće održati ih zadovoljnima i sretnima.

Tehnologija

ReversingLabs: Kad radite s petabajtima podataka, tehnički izazovi su jedinstveni i često pomiču sve granice

Vodeće društvene mreže, antivirusne kompanije, korporacije i vladine agencije širom svijeta od malicioznog softvera štite se koristeći tehnologije razvijene u Zagrebu. S kakvim se sve izazovima susreću jer su stvorili najveću svjetsku bazu malwarea ispričali su nam voditelji tehničkih timova ReversingLabsa.

Novost

MUP u suradnji s Metom predstavio hrvatsku verziju Amber Alerta, NENO Alarm

NENO Alarm pomoći će u pronalaženju nestale djece u Hrvatskoj - ako dijete nestane, Ministarstvo unutarnjih poslova će obavijestiti tvrtku Meta, koja će inicirati upozorenje tj. NENO Alarm građanima - korisnicima društvenih mreža Facebook i Instagram – u krugu od 60 kilometara.

Intervju

Dobili ste poruku od “prijatelja” koji moli da mu kupite bon? Evo što kaže policija o takvim prijevarama

Uvijek razmišljaš kako se upravo tako nešto neće dogoditi tebi... Ali ipak se dogodi.