Najnovija verzija GPT-4 ove godine nas je toliko obuzela svojim mogućnostima da se rijetko tko pitao: a na čemu će se trenirati petica? Sad kad je prošla faza medenog mjeseca, mnogi su se sjetili da su GPT modeli trenirani na tuđim sadržajima. Hoćemo li ga za to blokirati?
Možda se, za početak – pitate: kako bismo uopće mogli blokirati ChatGPT? Kao velika većina alata koji prikupljaju podatke s interneta, i OpenAI ima svog bota koji gmiže po webovima neometano. Upute od Open AI-ja kako mu ne dozvoliti da pristupi vašem webu dobili smo još u ožujku za drugog GPTBota, kada je lansirana četvorka.
Međutim, tada smo zbog hypea svi pretraživali što možemo s ChatGPT-jem, a ne kako ga onemogućiti. Glas propitivanja se pomalo budio kako je zanos jenjavao, a kroz naredne tjedne se otvaralo sve više pitanja o privatnosti, sigurnosti, inkluzivnosti te autorskim i drugim vezanim pravima uz AI rješenja.
Sad kad znamo da ga možemo lako onemogućiti, ostaju još pitanja – trebamo li i želimo li?
Open AI je privatna tvrtka.
Besplatna web verzija ChatGPT-a trenutno vrti poboljšani jezični model GPT-3.5, dok je OpenAI sljedeću generaciju (4) zatvorio za javnost. Ovom osjetno jačem modelu sada možete pristupiti jedino ako ćete plaćati pretplatu – ChatGPT Plus. OpenAI zarađuje i kroz prodaju ChatGPT API-ja (tvrtke mogu model trenirati na svojim podacima), ali i prodajom podatkovnih paketa (data setova).
Predviđa se da će ChatGPT kroz te izvore svojoj matičnoj tvrtki, Open AI-ju, donijeti 200 milijuna dolara prihoda u 2023. godini.
Lijepa brojka, ali malo splasne oduševljenje napretkom tehnologije kad shvatite da je model za koji prodaju pretplatu (i podatke!) nastao treniranjem na – tuđim podacima.
Istina, možemo raspravljati o tome koliko je ono što ChatGPT izbaci kao rezultat ipak njegov originalni produkt, koji nije (uvijek) samo lijepljenje paragrafa već novotvorevina, nastala kontekstualnim povezivanjem (ako ne već kritičkim i intelektualnim promišljanjem), ali više o autorskom pravu AI modela u ovom tekstu.
Opet, ako pričamo o takvim originalnim umotvorinama, ako mi kao ljudi – mučeći se stvoriti originalan sadržaj za svoje srednjoškolske eseje, seminare i fakultetske diplome od onoga što smo istražili i pročitali – moramo citirati naše izvore (ne kopirati!), možda bismo isto trebali tražiti i jedan AI model?
Ako oni ne mogu staviti izvore, možda vi ne trebate dati pristup?
Kao netko tko živi od broja posjeta na web stranicama, Matija Čaić, SEO stručnjak smatra da bi ChatGPT bot trebalo blokirati dok god OpenAI ne krene prikazivati izvore s kojih je uzimao podatke.
Google čak i u svojim obogaćenim rezultatima prikazuje stranicu na kojoj se informacija može naći i provjeriti.
Matija misli na podatke koji se nalaze sa strane rezultata pretraživanja na Googleu (Zero click SERP), a koji izdvajaju bitne informacije u vezi pretrage te tako često, ako je u pitanju neko standardno često pitanje, nemate potrebe da uđete na sam izvor stranice. Svejedno, izvor je uvijek niže naveden.
OpenAI zapravo koristi trud i znanje ljudi koji stvaraju sadržaj na internetu za vlastitu dobit, a bez da vrate nešto natrag. Po meni bi najbolje rješenje bilo da OpenAI krene prikazivati stranice s kojih je koju informaciju uzeo. Druga opcija je da profit dijeli s vlasnicima stranica.
Međutim…
Kad su u pitanju veliki jezični modeli, problem je u tome što vam ChatGPT i slični AI alati ne mogu samo ispljunuti što im je pomoglo da sastave prezentaciju koja vama treba sutra za predavanje/sastanak. I naglašavam ovdje pomoglo, jer ChatGPT ne kopira i ne gradi sadržaj kao što mi radimo s citiranjem. ChatGPT je učio na vašem blogu o growth marketingu, ali rijetko kad je s njega doslovno uzeo paragraf.
Od tisuću sličnih blogova i medijskih članaka, ChatGPT je zapravo samo dobio kontekst o growth marketingu na temelju kojeg onda slaže, na licu mjesta, riječi i rečenice prema potrebi upita.
Zato je važno naglasiti kako rade jezični modeli (iako veoma pojednostavljeno): vi na upit ChatGPT-ju dobivate odgovor koji se može promatrati kao aproksimacija najvjerojatnijih informacija s blogova i članaka koje je ChatGPT prožvakao na temu. Samo što je rezultat tog “prosjeka” (ili bolje rečeno medijana) – tekstualni sadržaj.
Ako se stoga pitamo je li ChatGPT-ju izvedivo uopće dati nam izvore, lako je zaključiti da bi vam za dva paragrafa o growth marketingu poznati AI alat mogao nabacati 10.000 izvora.
101: Kako ipak natjerati ChatGPT da vam da izvore?
Zaključno, ChatGPT vam neće moći dati direktne izvore onoga što vam je odgovorio, no moći će vam dati neke generalne izvore na temu.
Ako su vam u redu i takve informacije, ChatGPT-ju specificirajte da želite raznolikije, relevantnije i vjerodostojnije izvore. Iako ChatGPT neće uvijek povezati što je relevantno ili kredibilno za određenu temu, vi ga dodatnim upitom možete usmjeriti na što točno ciljate.

Evo par prijedloga kako napraviti takve rafinirane upite:
- Specificirajte broj izvora: Please provide 10 sources for the previous answer (Molim te pošalji mi 10 izvora za prethodnih odgovor).
- Specificirajte vrstu izvora: Please give me 5 URL / journal / book sources that could be helpful on this topic (Molim te daj mi 5 URL izvora / znanstvenih članaka / knjiga koji mi mogu pomoći oko ove teme)
- Specificirajte period: Please provide sources published from 2019. through 2021. (Molim te pošalji mi izvore koji su objavljeni u razdoblju od 2019. do 2021. godine)
- Specificirajte stranu/smjer: Please give me 5 reputable sources to support my argument on (…) (Molim te daj mi 5 kredibilnih izvora koji podupiru moj argument na temu).
Međutim, nemojte zaboraviti da ChatGPT raspolaže informacijama samo do 2021. godine, ali i da barata s jako malo izvora iz vremena prije interneta.
Kako blokirati novi GPTBot?
Niste li zadovoljni ovim rješenjem ni kao korisnici ChatGPT-ja ni kao autori na čijem je sadržaju možda trenirao, ne brinite – kako sam navela na početku, OpenAI je dao upute kako ga blokirati.
Kako biste onemogućili GPTBotu pristup vašoj web stranici, morate imati pristup dokumentima odnosno direktoriju na koji su smješteni dokumenti vašeg weba (ili zamoliti svog webmastera da to učini za vas). Tamo ćete vjerojatno već naći postojeći robots.txt dokument, unutar kojeg trebate unijeti:
User-agent: GPTBot Disallow: /
Ako želite GPTBotu omogućiti pristup samo dijelovima vaše stranice, u robots.txtu ih možete specificirati:
User-agent: GPTBot Allow: /directory-1/ Disallow: /directory-2/
Osim bota, OpenAI ima i vlastitog crawlera koji radi pozive na web stranice s nekoliko IP adresa (ovdje možete provjeriti koje).
Za veće dobro i bolje AI modele?
Blokirati ChatGPT Bot čini se kao suvisla odluka, pogotovo ako ste aktivni kreatori sadržaja online. S druge strane, Matija ipak ističe koliko je Chat GPT koristan alat…
Ako mu krenemo blokirati pristup novim informacijama, izgubit ćemo na kvaliteti onoga što nam pruža.
Činjenica je da je Open AI razvio state-of-the-art transformere. Njihovu moć koristimo i kao pojedinci, ali i kroz alate nekih od najvećih tvrtki svijeta, od Asane, Canve i Notiona do Spotifya i Duo Linga. Ne možemo reći da svijet nije barem mrvu napredovao zbog truda 300-injak inženjera u San Franciscu.
U konačnici, dopustite li ChatGPT botu pristup vašoj web stranici, pridonosite skupu podataka na kojima će se trenirati i nastati još bolji modeli, čime se poboljšava cjelokupni ekosustav umjetne inteligencije.
Što vi imate od toga? Pa, vrlo lako – mnogo. Svi danas uživamo u moru znanja i informacija koje postoje na internetu. Da nije bilo ljudi koji su htjeli podijeliti svoja znanja i razmišljanja, što bi internet uopće bio? Adresar?
Iako je jasno da svi žele dobiti priznanje za svoj rad u nekom obliku, što je apsolutno legitimno, pitanja oko autorskih prava i AI alata će još dugo ostati u sivoj zoni toga što bi ili ne bi trebalo. Do tad, samo je na vama i vašim principima hoćete li htjeti blokirati ChatGPT da vam ne češlja vašu web stranicu i sadržaje.
Za vas koji pišete i stvarate druge vrste multimedijalnog sadržaja i onda ih objavljujete na tuđim web stranicama, mogu samo poželjeti sreću jer već znamo da se platforme poput DeviantArta nisu iskazale u očuvanju autorskih prava svojih korisnika.
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.
Pravila ponašanja
Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:
Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.
Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.