Trebate li blokirati GPTBot na vašem webu?

Trebate li blokirati GPTBot na vašem webu?

Najnovija verzija GPT-4 ove godine nas je toliko obuzela svojim mogućnostima da se rijetko tko pitao: a na čemu će se trenirati petica? Sad kad je prošla faza medenog mjeseca, mnogi su se sjetili da su GPT modeli trenirani na tuđim sadržajima. Hoćemo li ga za to blokirati?

Možda se, za početak – pitate: kako bismo uopće mogli blokirati ChatGPT? Kao velika većina alata koji prikupljaju podatke s interneta, i OpenAI ima svog bota koji gmiže po webovima neometano. Upute od Open AI-ja kako mu ne dozvoliti da pristupi vašem webu dobili smo još u ožujku za drugog GPTBota, kada je lansirana četvorka.

Međutim, tada smo zbog hypea svi pretraživali što možemo s ChatGPT-jem, a ne kako ga onemogućiti. Glas propitivanja se pomalo budio kako je zanos jenjavao, a kroz naredne tjedne se otvaralo sve više pitanja o privatnosti, sigurnosti, inkluzivnosti te autorskim i drugim vezanim pravima uz AI rješenja.

Sad kad znamo da ga možemo lako onemogućiti, ostaju još pitanja – trebamo li i želimo li?

Open AI je privatna tvrtka.

Besplatna web verzija ChatGPT-a trenutno vrti poboljšani jezični model GPT-3.5, dok je OpenAI sljedeću generaciju (4) zatvorio za javnost. Ovom osjetno jačem modelu sada možete pristupiti jedino ako ćete plaćati pretplatu – ChatGPT Plus. OpenAI zarađuje i kroz prodaju ChatGPT API-ja (tvrtke mogu model trenirati na svojim podacima), ali i prodajom podatkovnih paketa (data setova).

Predviđa se da će ChatGPT kroz te izvore svojoj matičnoj tvrtki, Open AI-ju, donijeti 200 milijuna dolara prihoda u 2023. godini.

Lijepa brojka, ali malo splasne oduševljenje napretkom tehnologije kad shvatite da je model za koji prodaju pretplatu (i podatke!) nastao treniranjem na – tuđim podacima.

Istina, možemo raspravljati o tome koliko je ono što ChatGPT izbaci kao rezultat ipak njegov originalni produkt, koji nije (uvijek) samo lijepljenje paragrafa već novotvorevina, nastala kontekstualnim povezivanjem (ako ne već kritičkim i intelektualnim promišljanjem), ali više o autorskom pravu AI modela u ovom tekstu.

Opet, ako pričamo o takvim originalnim umotvorinama, ako mi kao ljudi – mučeći se stvoriti originalan sadržaj za svoje srednjoškolske eseje, seminare i fakultetske diplome od onoga što smo istražili i pročitali – moramo citirati naše izvore (ne kopirati!), možda bismo isto trebali tražiti i jedan AI model?

Ako oni ne mogu staviti izvore, možda vi ne trebate dati pristup?

Kao netko tko živi od broja posjeta na web stranicama, Matija Čaić, SEO stručnjak smatra da bi ChatGPT bot trebalo blokirati dok god OpenAI ne krene prikazivati izvore s kojih je uzimao podatke.

Google čak i u svojim obogaćenim rezultatima prikazuje stranicu na kojoj se informacija može naći i provjeriti.

Matija misli na podatke koji se nalaze sa strane rezultata pretraživanja na Googleu (Zero click SERP), a koji izdvajaju bitne informacije u vezi pretrage te tako često, ako je u pitanju neko standardno često pitanje, nemate potrebe da uđete na sam izvor stranice. Svejedno, izvor je uvijek niže naveden.

OpenAI zapravo koristi trud i znanje ljudi koji stvaraju sadržaj na internetu za vlastitu dobit, a bez da vrate nešto natrag. Po meni bi najbolje rješenje bilo da OpenAI krene prikazivati stranice s kojih je koju informaciju uzeo. Druga opcija je da profit dijeli s vlasnicima stranica.

Međutim…

Kad su u pitanju veliki jezični modeli, problem je u tome što vam ChatGPT i slični AI alati ne mogu samo ispljunuti što im je pomoglo da sastave prezentaciju koja vama treba sutra za predavanje/sastanak. I naglašavam ovdje pomoglo, jer ChatGPT ne kopira i ne gradi sadržaj kao što mi radimo s citiranjem. ChatGPT je učio na vašem blogu o growth marketingu, ali rijetko kad je s njega doslovno uzeo paragraf.

Od tisuću sličnih blogova i medijskih članaka, ChatGPT je zapravo samo dobio kontekst o growth marketingu na temelju kojeg onda slaže, na licu mjesta, riječi i rečenice prema potrebi upita.

Zato je važno naglasiti kako rade jezični modeli (iako veoma pojednostavljeno): vi na upit ChatGPT-ju dobivate odgovor koji se može promatrati kao aproksimacija najvjerojatnijih informacija s blogova i članaka koje je ChatGPT prožvakao na temu. Samo što je rezultat tog “prosjeka” (ili bolje rečeno medijana) – tekstualni sadržaj.

Ako se stoga pitamo je li ChatGPT-ju izvedivo uopće dati nam izvore, lako je zaključiti da bi vam za dva paragrafa o growth marketingu poznati AI alat mogao nabacati 10.000 izvora.

101: Kako ipak natjerati ChatGPT da vam da izvore?

Zaključno, ChatGPT vam neće moći dati direktne izvore onoga što vam je odgovorio, no moći će vam dati neke generalne izvore na temu.

Ako su vam u redu i takve informacije, ChatGPT-ju specificirajte da želite raznolikije, relevantnije i vjerodostojnije izvore. Iako ChatGPT neće uvijek povezati što je relevantno ili kredibilno za određenu temu, vi ga dodatnim upitom možete usmjeriti na što točno ciljate.

Kako smo vidjeli u nedavnom članku o autorskom pravu, ChatGPT iako zna ograničenja pisanja haikua, na pola puta se može “zaboraviti”. Kad god primijetite da se zblesirao, ispravite ga.

Evo par prijedloga kako napraviti takve rafinirane upite:

  • Specificirajte broj izvora: Please provide 10 sources for the previous answer (Molim te pošalji mi 10 izvora za prethodnih odgovor).
  • Specificirajte vrstu izvora: Please give me 5 URL / journal / book sources that could be helpful on this topic (Molim te daj mi 5 URL izvora / znanstvenih članaka / knjiga koji mi mogu pomoći oko ove teme)
  • Specificirajte period: Please provide sources published from 2019. through 2021. (Molim te pošalji mi izvore koji su objavljeni u razdoblju od 2019. do 2021. godine)
  • Specificirajte stranu/smjer: Please give me 5 reputable sources to support my argument on (…) (Molim te daj mi 5 kredibilnih izvora koji podupiru moj argument na temu).

Međutim, nemojte zaboraviti da ChatGPT raspolaže informacijama samo do 2021. godine, ali i da barata s jako malo izvora iz vremena prije interneta.

Kako blokirati novi GPTBot?

Niste li zadovoljni ovim rješenjem ni kao korisnici ChatGPT-ja ni kao autori na čijem je sadržaju možda trenirao, ne brinite – kako sam navela na početku, OpenAI je dao upute kako ga blokirati.

Kako biste onemogućili GPTBotu pristup vašoj web stranici, morate imati pristup dokumentima odnosno direktoriju na koji su smješteni dokumenti vašeg weba (ili zamoliti svog webmastera da to učini za vas). Tamo ćete vjerojatno već naći postojeći robots.txt dokument, unutar kojeg trebate unijeti:

User-agent: GPTBot
Disallow: /

Ako želite GPTBotu omogućiti pristup samo dijelovima vaše stranice, u robots.txtu ih možete specificirati:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

Osim bota, OpenAI ima i vlastitog crawlera koji radi pozive na web stranice s nekoliko IP adresa (ovdje možete provjeriti koje).

Za veće dobro i bolje AI modele?

Blokirati ChatGPT Bot čini se kao suvisla odluka, pogotovo ako ste aktivni kreatori sadržaja online. S druge strane, Matija ipak ističe koliko je Chat GPT koristan alat…

Ako mu krenemo blokirati pristup novim informacijama, izgubit ćemo na kvaliteti onoga što nam pruža.

Činjenica je da je Open AI razvio state-of-the-art transformere. Njihovu moć koristimo i kao pojedinci, ali i kroz alate nekih od najvećih tvrtki svijeta, od Asane, Canve i Notiona do Spotifya i Duo Linga. Ne možemo reći da svijet nije barem mrvu napredovao zbog truda 300-injak inženjera u San Franciscu.

U konačnici, dopustite li ChatGPT botu pristup vašoj web stranici, pridonosite skupu podataka na kojima će se trenirati i nastati još bolji modeli, čime se poboljšava cjelokupni ekosustav umjetne inteligencije.

Što vi imate od toga? Pa, vrlo lako – mnogo. Svi danas uživamo u moru znanja i informacija koje postoje na internetu. Da nije bilo ljudi koji su htjeli podijeliti svoja znanja i razmišljanja, što bi internet uopće bio? Adresar?

Iako je jasno da svi žele dobiti priznanje za svoj rad u nekom obliku, što je apsolutno legitimno, pitanja oko autorskih prava i AI alata će još dugo ostati u sivoj zoni toga što bi ili ne bi trebalo. Do tad, samo je na vama i vašim principima hoćete li htjeti blokirati ChatGPT da vam ne češlja vašu web stranicu i sadržaje.

Za vas koji pišete i stvarate druge vrste multimedijalnog sadržaja i onda ih objavljujete na tuđim web stranicama, mogu samo poželjeti sreću jer već znamo da se platforme poput DeviantArta nisu iskazale u očuvanju autorskih prava svojih korisnika.

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

eUsluge

Grad Zagreb omogućio potpun uvid u proračun kroz aplikaciju iTransparentnost

Nova aplikacija omogućuje svakom građaninu da detaljno prouči gradski porarčun po različitim parametrima.

Startupi

Što je to R&D potencijal – i kakve veze ima s razvojem startupa?

Je li startup nacija u kojoj su nastali tech giganti kao Skype, Wise, Bolt i Pipedrive to postala slučajno, otkrijte sa mnom na putu u Estoniju.

Nesortirano

Što je Akt o čipovima – i kako će doprinjeti tehnološkom razvitku Hrvatske

Jačanje konkurentnosti Europske unije u industriji poluvodiča prilika je i za Hrvatsku koja u sklopu 43 milijarde eura vrijedne incijative priprema otvaranje edukacijskih centara.

Što ste propustili

Panel

Hrvatski game developeri o stvaranju “ozbiljnih” videoigara

S predstavnicima game dev studija, ali i drugih privatnih tvrtki i dobrotvornih organizacija, raspravljamo o razvoju videoigara kojima svrha nije samo zabava, već i edukacija.

Startupi

Ivan Mrvoš: “Include više nije samo ‘onaj mali s pametnim klupama'”

Include, solinski startup poznat po pametnim klupama Steora, okrenuo se razvoju i proizvodnji novih proizvoda. Mrvoš, koji još nema ni 30 godina, a već je iskusni poduzetnik s respektabilnom karijerom, za Netokraciju je ispričao kako se i koliko ta tvrtka promijenila. Nedavno smo mogli pročitati da bi mogli promijeniti i vlasnika...

Esport

Peta sezona SET-a zaključena u Infobipu: Od 22 fakulteta pobjednički je varaždinski FOI

Student Esports Tournament, jedan od najpoznatijih studentskih esport događaja u Hrvatskoj, petu sezonu završio je u spektakularnoj LAN završnici koja se održala u prostorima Infobipa u Zagrebu.

Novost

Goran Bosankić u Field39 stiže na poziciju Chief Revenue Officera

Nakon više od 6 godina u Assecu SEE, a potom isto toliko u ABC Tech grupi, Goran Bosankić dolazi u Field39 kao Chief Revenue Officer i član Upravnog odbora.

Digitalni marketing

Super Bowl fenomen iliti “Vrijeme je da se vratite pred TV. Počinju reklame.”

Dok sam bio u Americi netom prije Super Bowla jedno mi je postalo jasno. Američki nogomet tamo je religija, a SuperBowl kao Božić. Samo što se za ovaj Božić svi okupe oko TV-a gledati reklame!

Novost

Teo Širola iz Muzeja iluzija proglašen najboljim mladim menadžerom 2023. godine

Hrvatsko udruženje menadžera i poduzetnika (HUM) CROMA dodijelilo je predsjedniku tvrtke Metamorfoza, koja upravlja globalnom mrežom Muzeja iluzija, nagradu za mladog menadžera 2023. godine.