Trebate li blokirati GPTBot na vašem webu?

Trebate li blokirati GPTBot na vašem webu?

Najnovija verzija GPT-4 ove godine nas je toliko obuzela svojim mogućnostima da se rijetko tko pitao: a na čemu će se trenirati petica? Sad kad je prošla faza medenog mjeseca, mnogi su se sjetili da su GPT modeli trenirani na tuđim sadržajima. Hoćemo li ga za to blokirati?

Možda se, za početak – pitate: kako bismo uopće mogli blokirati ChatGPT? Kao velika većina alata koji prikupljaju podatke s interneta, i OpenAI ima svog bota koji gmiže po webovima neometano. Upute od Open AI-ja kako mu ne dozvoliti da pristupi vašem webu dobili smo još u ožujku za drugog GPTBota, kada je lansirana četvorka.

Međutim, tada smo zbog hypea svi pretraživali što možemo s ChatGPT-jem, a ne kako ga onemogućiti. Glas propitivanja se pomalo budio kako je zanos jenjavao, a kroz naredne tjedne se otvaralo sve više pitanja o privatnosti, sigurnosti, inkluzivnosti te autorskim i drugim vezanim pravima uz AI rješenja.

Sad kad znamo da ga možemo lako onemogućiti, ostaju još pitanja – trebamo li i želimo li?

Open AI je privatna tvrtka.

Besplatna web verzija ChatGPT-a trenutno vrti poboljšani jezični model GPT-3.5, dok je OpenAI sljedeću generaciju (4) zatvorio za javnost. Ovom osjetno jačem modelu sada možete pristupiti jedino ako ćete plaćati pretplatu – ChatGPT Plus. OpenAI zarađuje i kroz prodaju ChatGPT API-ja (tvrtke mogu model trenirati na svojim podacima), ali i prodajom podatkovnih paketa (data setova).

Predviđa se da će ChatGPT kroz te izvore svojoj matičnoj tvrtki, Open AI-ju, donijeti 200 milijuna dolara prihoda u 2023. godini.

Lijepa brojka, ali malo splasne oduševljenje napretkom tehnologije kad shvatite da je model za koji prodaju pretplatu (i podatke!) nastao treniranjem na – tuđim podacima.

Istina, možemo raspravljati o tome koliko je ono što ChatGPT izbaci kao rezultat ipak njegov originalni produkt, koji nije (uvijek) samo lijepljenje paragrafa već novotvorevina, nastala kontekstualnim povezivanjem (ako ne već kritičkim i intelektualnim promišljanjem), ali više o autorskom pravu AI modela u ovom tekstu.

Opet, ako pričamo o takvim originalnim umotvorinama, ako mi kao ljudi – mučeći se stvoriti originalan sadržaj za svoje srednjoškolske eseje, seminare i fakultetske diplome od onoga što smo istražili i pročitali – moramo citirati naše izvore (ne kopirati!), možda bismo isto trebali tražiti i jedan AI model?

Ako oni ne mogu staviti izvore, možda vi ne trebate dati pristup?

Kao netko tko živi od broja posjeta na web stranicama, Matija Čaić, SEO stručnjak smatra da bi ChatGPT bot trebalo blokirati dok god OpenAI ne krene prikazivati izvore s kojih je uzimao podatke.

Google čak i u svojim obogaćenim rezultatima prikazuje stranicu na kojoj se informacija može naći i provjeriti.

Matija misli na podatke koji se nalaze sa strane rezultata pretraživanja na Googleu (Zero click SERP), a koji izdvajaju bitne informacije u vezi pretrage te tako često, ako je u pitanju neko standardno često pitanje, nemate potrebe da uđete na sam izvor stranice. Svejedno, izvor je uvijek niže naveden.

OpenAI zapravo koristi trud i znanje ljudi koji stvaraju sadržaj na internetu za vlastitu dobit, a bez da vrate nešto natrag. Po meni bi najbolje rješenje bilo da OpenAI krene prikazivati stranice s kojih je koju informaciju uzeo. Druga opcija je da profit dijeli s vlasnicima stranica.

Međutim…

Kad su u pitanju veliki jezični modeli, problem je u tome što vam ChatGPT i slični AI alati ne mogu samo ispljunuti što im je pomoglo da sastave prezentaciju koja vama treba sutra za predavanje/sastanak. I naglašavam ovdje pomoglo, jer ChatGPT ne kopira i ne gradi sadržaj kao što mi radimo s citiranjem. ChatGPT je učio na vašem blogu o growth marketingu, ali rijetko kad je s njega doslovno uzeo paragraf.

Od tisuću sličnih blogova i medijskih članaka, ChatGPT je zapravo samo dobio kontekst o growth marketingu na temelju kojeg onda slaže, na licu mjesta, riječi i rečenice prema potrebi upita.

Zato je važno naglasiti kako rade jezični modeli (iako veoma pojednostavljeno): vi na upit ChatGPT-ju dobivate odgovor koji se može promatrati kao aproksimacija najvjerojatnijih informacija s blogova i članaka koje je ChatGPT prožvakao na temu. Samo što je rezultat tog “prosjeka” (ili bolje rečeno medijana) – tekstualni sadržaj.

Ako se stoga pitamo je li ChatGPT-ju izvedivo uopće dati nam izvore, lako je zaključiti da bi vam za dva paragrafa o growth marketingu poznati AI alat mogao nabacati 10.000 izvora.

101: Kako ipak natjerati ChatGPT da vam da izvore?

Zaključno, ChatGPT vam neće moći dati direktne izvore onoga što vam je odgovorio, no moći će vam dati neke generalne izvore na temu.

Ako su vam u redu i takve informacije, ChatGPT-ju specificirajte da želite raznolikije, relevantnije i vjerodostojnije izvore. Iako ChatGPT neće uvijek povezati što je relevantno ili kredibilno za određenu temu, vi ga dodatnim upitom možete usmjeriti na što točno ciljate.

Kako smo vidjeli u nedavnom članku o autorskom pravu, ChatGPT iako zna ograničenja pisanja haikua, na pola puta se može “zaboraviti”. Kad god primijetite da se zblesirao, ispravite ga.

Evo par prijedloga kako napraviti takve rafinirane upite:

  • Specificirajte broj izvora: Please provide 10 sources for the previous answer (Molim te pošalji mi 10 izvora za prethodnih odgovor).
  • Specificirajte vrstu izvora: Please give me 5 URL / journal / book sources that could be helpful on this topic (Molim te daj mi 5 URL izvora / znanstvenih članaka / knjiga koji mi mogu pomoći oko ove teme)
  • Specificirajte period: Please provide sources published from 2019. through 2021. (Molim te pošalji mi izvore koji su objavljeni u razdoblju od 2019. do 2021. godine)
  • Specificirajte stranu/smjer: Please give me 5 reputable sources to support my argument on (…) (Molim te daj mi 5 kredibilnih izvora koji podupiru moj argument na temu).

Međutim, nemojte zaboraviti da ChatGPT raspolaže informacijama samo do 2021. godine, ali i da barata s jako malo izvora iz vremena prije interneta.

Kako blokirati novi GPTBot?

Niste li zadovoljni ovim rješenjem ni kao korisnici ChatGPT-ja ni kao autori na čijem je sadržaju možda trenirao, ne brinite – kako sam navela na početku, OpenAI je dao upute kako ga blokirati.

Kako biste onemogućili GPTBotu pristup vašoj web stranici, morate imati pristup dokumentima odnosno direktoriju na koji su smješteni dokumenti vašeg weba (ili zamoliti svog webmastera da to učini za vas). Tamo ćete vjerojatno već naći postojeći robots.txt dokument, unutar kojeg trebate unijeti:

User-agent: GPTBot
Disallow: /

Ako želite GPTBotu omogućiti pristup samo dijelovima vaše stranice, u robots.txtu ih možete specificirati:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

Osim bota, OpenAI ima i vlastitog crawlera koji radi pozive na web stranice s nekoliko IP adresa (ovdje možete provjeriti koje).

Za veće dobro i bolje AI modele?

Blokirati ChatGPT Bot čini se kao suvisla odluka, pogotovo ako ste aktivni kreatori sadržaja online. S druge strane, Matija ipak ističe koliko je Chat GPT koristan alat…

Ako mu krenemo blokirati pristup novim informacijama, izgubit ćemo na kvaliteti onoga što nam pruža.

Činjenica je da je Open AI razvio state-of-the-art transformere. Njihovu moć koristimo i kao pojedinci, ali i kroz alate nekih od najvećih tvrtki svijeta, od Asane, Canve i Notiona do Spotifya i Duo Linga. Ne možemo reći da svijet nije barem mrvu napredovao zbog truda 300-injak inženjera u San Franciscu.

U konačnici, dopustite li ChatGPT botu pristup vašoj web stranici, pridonosite skupu podataka na kojima će se trenirati i nastati još bolji modeli, čime se poboljšava cjelokupni ekosustav umjetne inteligencije.

Što vi imate od toga? Pa, vrlo lako – mnogo. Svi danas uživamo u moru znanja i informacija koje postoje na internetu. Da nije bilo ljudi koji su htjeli podijeliti svoja znanja i razmišljanja, što bi internet uopće bio? Adresar?

Iako je jasno da svi žele dobiti priznanje za svoj rad u nekom obliku, što je apsolutno legitimno, pitanja oko autorskih prava i AI alata će još dugo ostati u sivoj zoni toga što bi ili ne bi trebalo. Do tad, samo je na vama i vašim principima hoćete li htjeti blokirati ChatGPT da vam ne češlja vašu web stranicu i sadržaje.

Za vas koji pišete i stvarate druge vrste multimedijalnog sadržaja i onda ih objavljujete na tuđim web stranicama, mogu samo poželjeti sreću jer već znamo da se platforme poput DeviantArta nisu iskazale u očuvanju autorskih prava svojih korisnika.

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Startupi

57hours Viktora Marohnića narastao 4 puta i osigurao još 2,75 milijuna dolara

U ekskluzivnom intervjuu za Netokraciju, suosnivač brzorastuće avanturističke platforme Viktor Marohnić, sa svojim investitorima, otkriva planove.

Tvrtke i poslovanje

7 savjeta za učinkovitu izradu poslovnog plana (posebno za one koji nemaju vremena)

Nisu bez razloga velikani povijesti od Sun Tzua do Dwight D. Eisenhowera pričali o planiranju kao o svetom gralu uspjeha - i ne stoji bez razloga ona narodna: dobra organizacija je pola posla.

Novost

Ivan Burazin pokreće novi startup – Daytonu, već ima Fortune 500 klijente

Nakon tri godine, uspostave i razvoja Infobipovog Developer Experience odjela, Ivan Burazin, pokreće novi dev projekt. Time se nastavlja njegova startuperska priča i misija koja je počela prije više od dekadu - pomagati developerima da rade lakše, brže i učinkovitije. Upoznajemo njegov novi projekt, Daytonu!

Što ste propustili

Tvrtke i poslovanje

Sretan mu 25. rođendan: Kako smo počeli koristiti Googleove proizvode – i zašto (ne)ćemo nastaviti?

Povodom Googleovog rođendana prisjećamo se njegove prošlosti, nepobitnog utjecaja na sve digitalno što danas radimo, ali gledamo i u blisku budućnost koju će obilježiti dvije ključne riječi - umjetna inteligencija i monopol. Nismo propustili priliku ni nostalgično se prisjetiti pozivnica za Gmail, Googleovih pokušaja da napravi društvenu mrežu ili prvih susreta s Googleom, što je za neke zapravo bio YouTube.

Novost

U ZICER-u startupe čeka 150.000 eura, a prijave za akceleracijske programe traju još samo ovaj tjedan

Vodeći hrvatski startup hub ZICER otvorio i program za uspješno lansiranje na globalno tržište.

Umjetna inteligencija

500 tisuća korisnika koristi tehnologiju ovog hrvatskog AI startupa

S vremena na vrijeme, pojavi se neki startup koji marljivo radi "ispod radara", a onda odluči podijeliti svoju priču. Prvi donosimo intervju s TensorPixom koji od nedavno broji preko pola milijuna korisnika.

Izvještaj

Lekcije inženjerke iz Shopifya: kako koristiti AI za brži, bolji i lakši razvoj softvera?

Umjetna inteligencija i inženjeri. Nekada se vole, nekada mrze, ali činjenica je da AI inženjerima može olakšati pisanje koda... (ako i sami znaju što rade).

Tvrtke i poslovanje

Sofascore i Span: Zašto se nismo prodali? Jer nam to ne treba – ako imaš tri auta, možeš voziti samo jedan.

Investicije i preuzimanja domaćih tvrtki glavne su teme naše male poduzetničke scene, ali koliko god se pričalo, često tema o neovisnosti ostane postrani. Srećom, ove godine se otvorila na 16. Weekendu.

Programiranje

“Design Handoff” je proces zbog kojeg developer i dizajner ne moraju imati “standoff”

Predaja bilokakvog projekta ne završava s vašom točkom na kraju - nego svih kojih se taj projekt usko tiče. Uz Neuralab prolazimo kako od “ja sam svoje riješio” doći do kvalitetnog, strukturiranog “design handoffa” koji će značajno olakšati život svima uključenima: dizajnerima, developerima, PM-ovima, klijentima…