ChatGPT prošao višu razinu državne mature iz hrvatskog jezika sa solidnom trojkom!

ChatGPT prošao višu razinu državne mature iz hrvatskog jezika sa solidnom trojkom!

Poznati AI model, ChatGPT prošao je razne testove raznih ljudi diljem svijeta, ali još ga nitko nije ispitao o hrvatskom jeziku i kulturi. Zato ga je hrvatski podatkovni znanstvenik testirao na državnoj maturi. Osim rezultata književnog i gramatičkog testa, donosimo i detaljan ispravak eseja profesorice hrvatskog jezika.

Ako ste tijekom ChatGPT hypea došli u napast da testirate mogućnosti ovog AI modela, niste jedini. Ivan Židov, podatkovni znanstvenik, otišao je korak dalje i odlučio testirati ChatGPT na višoj razini državne mature iz hrvatskog jezika koja je provedena prošle godine.

Osim što je prošao višu razinu sa solidnom trojkom, Ivan je dokazao kako je ChatGPT pismeniji od njega. Model je ostvario prilično dobre rezultate:

Inače Lead Data Scientist u TalentLyftu, Ivan je svoj prvi susret s GPT tehnologijom imao još prije dvije godine. Tada je već prepoznao njegovu snagu, ali za njega je najveće iznenađenje predstavljao najnoviji ChatGPT model. U ovaj eksperiment tako ga je gurnula čista znatiželja s obzirom na to da prati mnogo stručnjaka za AI na LinkedInu te stalno čita objave kako je ChatGPT položio neki novi test…

Htio sam ga staviti na državnu maturu da vidim kako će proći. Kako sam matematičar, prva ideja mi je bila matura iz matematike. Međutim, smatrao sam kako će ljude više zanimati njegovo znanje hrvatskog jezika jer takav test (koliko ja znam) još nije proveden.

Većina tih testova na koje je Ivan naletio na LinkedInu nisu imale dokaze položenog testa. Zato je on sam temeljito proveo testiranje čije rezultate svi mogu vidjeti. Osim rezultata sa samog ispita, donosimo i detaljan ispravak eseja, koji je ispravila profesorica hrvatskog jezika koja inače ispravlja mature.

Kako je Ivan proveo eksperiment?

Za ispit iz književnosti i jezika Ivan je postavio sljedeća pravila:

  • ChatGPT smije koristiti samo ono što piše na maturi;
  • nema višestrukog generiranja (prvi odgovor se sprema);
  • smiju se dodati samo instrukcije za odgovaranje.

Paralelno je radio na 3 otvorena prozora. U jednom je bio otvoren ispit, u drugom ChatGPT i trećem exelica za evidenciju odgovora.

Kako je ChatGPT uvijek generirao puni odgovor, tako je Ivan odredio da samo prvo slovo odgovora stavi u stupac za predviđeni odgovor. Na kraju, taj predviđeni odgovor Ivan je usporedio s točnim odgovorima.

Poznavanje konteksta povećava šanse za dobivanje točnog odgovora

Ivan je potvrdio još jednom dosadašnje znanje o ChatGPT-u. Potreban mu je kontekst za optimalne rezultate. U zadacima iz književnosti koji su bili s tekstom imao je 80%, a na zadacima bez teksta 73% što potvrđuje kako mu je potreban kontekst kako bi došao do točnog zaključka.

Ivan je siguran kako bi rezultati u zadacima iz jezika bili bolji kada bi dobio više informacija. Jedan od takvih zadataka je 63. pitanje:

Koja je riječ u sljedećoj rečenici zanaglasnica? “Razmišljam o tome primjećuješ li i ti to.”

  1. o
  2. li
  3. i
  4. to

Kad bi se iznad samog zadatka stavila definicija zanaglasnica, vjerojatnije je da bi dobili točan odgovor, ističe Ivan.

Lijeni esejist: “Nisam ga nikako mogao natjerati da generira dovoljno riječi”

Pitanja iz književnosti i jezika nisu predstavljala problem, ali je zato esej donio svoje izazove.

Ivan je morao u ChatGPT ubaciti književni tekst na temelju kojeg će nastati esej i same upute koje glase:

  • Esej se mora sastojati od uvoda, razrade i zaključka.
  • Predstavite poetiku djela Patnje mladoga Werthera.
  • Usporedite na temelju djela u cjelini Lottin odnos prema Wertheru i prema Albertu.
  • Interpretirajte polazni tekst na sadržajnoj i stilskoj razini.
  • Protumačite na temelju čitateljskoga iskustva kako ljubav motivira postupke književnih likova.
  • Obrazložite svoje tvrdnje.
  • Esej mora biti dugačak i detaljan.

Tu je ChatGPT imao problem. Generirao je premalo teksta, tek sačinjen od 150 do 200 riječi:

Nisam ga nikako mogao natjerati da generira dovoljno riječi. Također, ponekad je generirao odgovor na engleskom ili srpskom.

Nakon desetak pokušaja, Ivan je odustao od ChatGPT-a i prebacio se na “klasični GPT”, odnosno GPT-3 (davinci-003). Za razliku od ChatGPT-a koji je limitiran u količini teksta/karaktera koje može “izbaciti” (više bi zahtijevalo puno procesorske moći), klasični GPT manje je limitiran i generira duže tekstove. Problema više nije bilo te je iz prvog pokušaja generiran odgovarajući esej kojeg je zatim ispravila profesorica hrvatskog jezika.

Cijeli esej i proces po kojemu je evaluiran možete vidjeti u ovom dokumentu. Tu je dostupan detaljan ispravak, a mi ćemo izdvojiti zaključak:

U eseju se uglavnom govori o sadržaju djela. Vrlo je precizno tumačenje odnosa između likova i opisivanje događaja. Nedostaju književnopovijesni i književnoteorijski pojmovi, citati iz teksta kojima se dokazuju tvrdnje i usporedba s drugim književnim tekstovima (čitateljsko iskustvo). Pravopisna i gramatička pravila primijenjena su u potpunosti, sintaktička pravila su donekle narušena.

“To je vrlo moćan alat i djecu treba educirati o njegovom korištenju.”

Nema sumnje, AI modeli poput ChatGPT-ja postat će dio naše svakodnevice. Nama je najbolji pokazatelj tome kad se na Netokraciji počnu nizati članci na temu.

Trenutno se u kontekstu ovoga vodi rasprava hoće li napredni AI modeli zamijeniti čovjeka i kako će on utjecati na školstvo. Međutim, kako je to lijepo sažela naša Antonija, promjene koje donosi napredak u tehnologiji kompleksnije su, sporije i manje seksi od bombastičnih predviđanja na društvenim mrežama.

Nikakvi potresi se neće dogoditi u školstvu, barem uskoro, ali to ne znači kako ne bi trebali razgovarati o njima pa je tako Ivan dao svoje mišljenje prema kojem zabranu ovog alata u školstvu smatra potpunim promašajem:

To je vrlo moćan alat i djecu treba educirati o njegovom korištenju. Ja ga osobno koristim kao mentora te  smatram da svakom djetetu treba mentor. Iako virtualni.

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Vodič

Morate podnijeti zahtjev za novu osobnu iskaznicu? Evo kako izbjeći gužvu na šalteru

Završetkom pandemije došao je službeni kraj maskama, ali i mnogim identifikacijskim dokumentima pa tako i osobnim iskaznicama bez kojih ne možete boraviti u Hrvatskoj. Ovo znači samo jedno... ogromni redovi na šalterima.

Web 3

Belma Gutlić: “Fokus s cijena kriptovaluta treba prebaciti na tehnologiju koja kriptovalute omogućava”

Danas se možemo pohvaliti da na našoj maloj sceni ne nedostaje konferencija vezanih uz blockchain i kriptovalute. Ipak, postoji jedan krovni naziv kojem se nitko dosad nije posvetio na jednak način, a koji možda zaslužuje i najviše pažnje.

Ekskluzivno

800.000 eura investicije za Turneo hrvatskih osnivača koji želi digitalizirati globalno tržište turističkih izleta

Za svoju B2B platformu za distribuciju izleta prikupili su 800.000 eura pre-seed investicije. Kažu da im je navjeća konkurencija olovka i papir, a s njom se bore brzom implementacijom, lakim korištenjem i - umjetnom inteligencijom.

Što ste propustili

Intervju

20 godina WordPressa: Prednosti i mane (zajednice) sustava na kojem počiva skoro 50% weba

Možemo li bolje proslaviti 20 godina WordPressa od detaljne analize u kojoj raspravljamo njegove uspone i padove, prednosti i mane, viziju za budućnost, ali i trenutne goreće probleme u WP ekosustavu...

Analiza

Kako istraživanje korisnika štedi novac i vrijeme

(Iako na prvu zvuči kako predugo traje i previše košta.)

Karijere

Gea Kariž je nova direktorica Mastercarda za Hrvatsku

Mastercard je objavio tri imenovanja u vodstvu kompanije u jugoistočnoj Europi kako bi ojačao prisutnost u regiji i bolje odgovorio na zahtjeve tržišta.

Novost

Infobipov Shift na svojoj prvoj konferenciji u SAD-u okupio gotovo 500 sudionika

Nakon što se probila u sami vrh developerskih konferencija u Europi, konferencija Shift napravila je svoj prvi korak u SAD-u.

Novost

Možemo li predvidjeti poplave? Google proširio mogućnosti Flood Huba i na Hrvatsku

Poplave su jedne od vodećih klimatskih prijetnji sigurnosti i egzistenciji ljudi pa tako nisu zaobišle ni Hrvatsku u kojoj je nastradao velik broj gradova.

Tvrtke i poslovanje

BitLucky: Od “ne namjeravam pobjeći, već zaraditi za sebe i klijenta” do prijava MUP-u

Možete li zamisliti kako se budite jedno jutro i otkrijete kako je vaš kripo broker zbog loših odluka potrošio sav novac kojeg je imao. Uključujući i svu štednju koje ste uložili...