Čije materijale AI koristi za učenje i čiji je materijal koji je stvorila? Kome se obraćamo za sve takve nedoumice? Pravu! Ali pravo trenutno vozi Prius, dok AI vozi Neveru.
Umjetna inteligencija je, u različitim pojavnim oblicima, među nama i duže no što možda percipiramo. Na vrata svijesti šire javnost je, rekla bih, malo jače pokucala pojavom generativnih AI rješenja koja demonstriraju određenu samostalnost u smislu kreiranja sadržaja – eseja, poezije, grafičkih radova, fotografija itd. – dakle mnoštva sadržaja koji se, kada je kreiran od strane fizičke osobe, može smatrati autorskim djelom.
Dakle, približila nam se (AI) upravo dovoljno da se, među ostalim, počnemo pitati nešto poput – čije materijale AI koristi za učenje i čiji je materijal koji je stvorila?
Kome se obraćamo za sve takve nedoumice? Pravu! Ali pravo trenutno vozi Prius, dok AI vozi Neveru.
Umjesto pitanja „kako se generativni AI uklapa u svijet propisa o intelektualnom vlasništvu“ realističnijim se čini pitati se kako se propisi o intelektualnom vlasništvu uklapaju i/ili kako će se uklopiti u svijet inovativnih AI rješenja.
Zlatni standard pod zlatnim zvijezdama (EU)
Autorsko djelo je, barem po definiciji hrvatskog zakona, originalna intelektualna tvorevina iz književnog, znanstvenog ili umjetničkog područja koja ima individualni karakter, bez obzira na način i oblik izražavanja, vrstu, vrijednost ili namjenu (…), dok je „autor“ fizička osoba koja je autorsko djelo stvorila.
Iako je u hijerarhiji svih propisa naš pri dnu piramide (ne kažem nevažan!), gornja definicija je svakako dovoljna za konkretnije formulirati uvodna pitanja – čije originalne intelektualne tvorevine i kako ih generativni AI koristi pri stvaranju novog sadržaja? Tko je autor tog novog sadržaja?
S obzirom na to da se pod okriljem dvanaest kružno postavljenih zlatnih zvijezda na plavoj podlozi smjera postaviti „zlatni standard“ AI regulative, možemo pokušati na gornja pitanja odgovoriti koristeći propise koji već jesu ili će tek biti doneseni pod tom zastavom.
Zato, imajući u vidu da se u ovome „naletu“ bavimo temom autorskog prava i generativnih AI rješenja, vrijedi razmotriti što o tome kaže trenutno dostupan prijedlog Uredbe Europskog parlamenta i Vijeća o utvrđivanju usklađenih pravila o umjetnoj inteligenciji (Akt o umjetnoj inteligenciji / AI Akt) čiju finalnu verziju željno iščekujemo (trenutno dostupna verzija prijedloga od strane Europske Komisije, dopunjena amandmanima Europskog Parlamenta) te što o tome kaže Direktiva (EU) 2019/790 o autorskom i srodnim pravima na jedinstvenom digitalnom tržištu (DAJDT).
Input faza – treniranje AI
Među očitim prvim pitanjima koja se nameću je ono krše li se nečija autorska prava u procesu treniranja generativnih AI rješenja. Takvo što autorima je osobito alarmantno kada se radi o „komercijalnim“ AI rješenjima široke upotrebe (npr. ChatGPT, DALL-E 2, Stable Diffusion kao open-source verzija, Adobe Firefly…).
U pravilu, treniranje AI alata podrazumijeva neki oblik korištenja (npr. reproduciranje, izvlačenje…) i analiziranja čitavih skupova podataka ili dijelova tih skupova, pri čemu sve ili dio toga što se koristi može biti nečije autorsko djelo zaštićeno autorskim i/ili srodnim pravima. Autorska prava sastoje se od tzv. moralnih i imovinskih segmenata. Svi segmenti autorskog prava primarno su rezervirani za autora u smislu da autor odlučuje što će i kako činiti sa svojim djelom – hoće li prava prenijeti na nekog trećeg nositelja, odnosno, hoće li i kako trećemu omogućiti korištenje svojeg djela.
Samo iznimno, zakonski te pod zakonskim pretpostavkama, prava autora mogu se protiv njihove volje ograničiti – a DAJDT, pa u skladu s njime i naš ZASP, kao jednu od takvih iznimaka predviđa slučajeve „rudarenja teksta i podataka“.
Rudarenje teksta i podataka?
Rudarenje teksta i podataka, prema DAJDT-u, podrazumijeva svaku automatiziranu analitičku tehniku čiji je cilj analiza teksta i podataka u digitalnom obliku radi stvaranja informacija, koje uključuju ali se ne ograničavaju na uzorke, trendove i korelacije.
To je još jedan u nizu primjera širokih i otvorenih definicija koje se koriste u sklopu regulative „digitalnog svijeta“ kako ga se ne bi nepotrebno kočilo i ograničavalo njegov razvoj. Zasad se čini podobnom da pod nju budu podvedene brojne tehnike treniranja za potrebe razvoja AI alata, uključivo generativnih AI alata.
Da bi to „rudarenje teksta i podataka“ bilo moguće bez posebnog odobrenja svakog pojedinog autora, nužno je predvidjeti zakonska ograničenja određenih autorskih prava koja su po svojoj naravi isključiva tj. rezervirana za autora (npr. prava odobravanja reproduciranja, prijevoda i prilagodbe autorskih djela).
Konkretno, zakonodavci država članica EU imali su zadatak donijeti propise kojima će implementirati cilj zadan DAJDT-om: u svrhu omogućavanja rudarenja teksta i podataka, mora postojati zakonska mogućnost da se, bez posebnog odobrenja autora (!), može vršiti reproduciranje i izvlačenje autorskih djela (čak i kada su ona objavljena na Internetu), te mora postojati i mogućnost za privremeno zadržavanje kopija nastalih u tome procesu.
Međutim, sve to će biti zakonita mogućnost za korisnika (npr. tech innovation firma):
- samo ako taj korisnik zakonito pristupi konkretnom djelu/drugom predmetu zaštite,
- te pod uvjetom da nositelj prava nad konkretnim djelom/predmetom zaštite – nije sebi izričito prava korištenja djela u tu svrhu rudarenja.
Ovaj potoni uvjet bismo mogli, radi praktičnosti, protumačiti kao „opt-out“ opciju za autore: ako autor/nositelj prava izričito za sebe pridrži prava korištenja svojih djela za svrhu rudarenja, time on demonstrira svoj „opt-out“ od gore opisane zakonske mogućnosti – mogućnosti predviđene radi poticanja inovacija i razvoja u privatnom sektoru.
Teret autorima!
Takav, gore opisani način formuliranja pravne regulacije, cilja olakšati razvoj AI alata bez da striktna i isključiva narav autorskog prava isti taj razvoj koči. No, time se, rekla bih, teret aktivne brige o autorskim pravima još značajnije prebacuje na samog autora. O dugoročnijim efektima ovakvog rješenja na omjer snaga autori vs. AI tech companies se može raspravljati (i već se raspravlja).
Autori bi sada trebali još aktivnije voditi računa o tome što hoće ili neće dopustiti glede svojih djela – tako što će, među ostalim, na primjerene načine izričito pridržati sebi prava u svrhu „rudarenja“ ( demonstrirati svoj opt-out) i time pravno onemogućiti rudarenje od strane trećih osoba za tzv. komercijalne svrhe (op.a. postoji i rudarenje u svrhe znanstvenog istraživanja kod kojeg nema opt-out mogućnosti).
Implementirajući odredbe DAJDT-a, naš je ZASP kao primjerene načine pridržaja prava predvidio: strojno čitljiv način koji uključuje metapodatke, opći uvjeti koji se odnose na mrežne stranice i uslugu, ugovorne odredbe ili jednostrane izjave nositelja prava.
U tome smislu, razvijeni su i razvijaju se alati koji omogućavaju autorima određene provjere jesu li njihova djela korištena za treniranje te za „izjaviti“ svoj opt-out (npr. spawning.ai – HaveIBeenTrained web).
Također, primjera radi, početkom ove godine se dosta pisalo o Adobe Creative Cloud setu aplikacija u opt-out kontekstu. Korisnici su primijetili da je u njihove postavke računa (accounta) uvedena nova opcija „content analysis“ koja je svima automatski podešena tako da je „opt-out button“ bio isključen. Dakle, korisnicima je prihvaćanje content analysis opcije bilo pre-programmed te su svoj opt-out morali učiniti aktivnom radnjom (uključiti opt-out button) u postavkama svojeg Adobe računa. Inače, prihvat opcije content analysis predviđa da Adobe može, parafrazirano: analizirati sadržaj clouda koristeći tehnike poput strojnog učenja (npr. za prepoznavanje uzoraka), a sve u svrhu poboljšanja proizvoda i usluga.
Pa iako je Adobe navodno demantirao da koristi sadržaj clouda svojih korisnika za treniranje eksperimentalnih generativnih AI algoritama, na njihovoj content analysis FAQ stranici stoji da Adobe doista može analizirati sadržaj pohranjen na njihovim serverima, a kada to čine da ga agregiraju s ostalim sadržajem te koriste tako agregirani sadržaj za treniranje svojih algoritama i poboljšavanje svojih proizvoda i usluga. Dakle, u principu je vrlo moguće da se npr. vaše i moje autorske fotografije pohranjene na Adobe serveru koriste za treniranje AI rješenja i alata (npr. Content-Aware Fill) – until we opt-out.

U svakom slučaju, mislim da je važan dio aktivne brige o pravima, u odnosu na autorska djela dostupna na internetu, primarno svijest o samome Internetu i njemu inherentnom manjku kontrole nad podacima, načinu stjecanja te kontrole, pa onda i s time povezana povećana pažnja prilikom objavljivanja djela na Internetu.
No, da bi ta briga o pravima doista mogla biti aktivna u smislu DAJDT-a te da bi autori mogli donijeti smislenu odluku hoće li ili neće iskoristiti opt-out mogućnost glede rudarenja teksta i podataka na internetu – nužno je da im se omogući informiranje o tome jesu li i koja njihova djela VEĆ možda korištena u sklopu treniranja određenih AI rješenja te ako jesu – na koji način.
Informirani “opt-out”
Recentno je Europski Parlament glasao o svojem prijedlogu teksta AI Akta tj. – prijedlogu koji uključuje amandmane u odnosu na inicijalni prijedlog teksta EU Komisije.
Ne ulazeći u detalje, ovdje samo kratka naznaka da EP prijedlog teksta AI Akta razlikuje AI sustave opće namjene (general purpose AI systems) od temeljnih AI modela (foundation model), pri čemu su generativna AI rješenja prepoznata kao vrsta temeljnog modela (op.a. za više o tome kakvo je shvaćanje temeljnih modela – vidi amandman 99. EP-a u sklopu uvodnih odredbi AI Akta).
U ovom našem kontekstu, bitnije od same klasifikacije AI sustava jest razmotriti prijedlog članka 28.b. AI Akta – članka koji propisuje obveze tzv. dobavljača AI sustava. Njime se predviđaju opće obveze svih dobavljača AI sustava (u smislu procjene rizika, transparentnosti i informiranja, sigurnosti itd.), ali i neke posebne obveze. Pa tako, u vezi gore spomenute informiranosti autora o tome koriste li se i na koji način njihova djela u treniranju generativnih AI alata, valja uočiti kako prijedlog stavka 4. članka 28.b. AI Akta propisuje posebne obveze za dobavljače temeljnih modela koji su dio AI generativnih sustava, među ostalim i:
- obvezu dokumentirati i staviti javnosti na raspolaganje dovoljno detaljan sažetak o uporabi podataka za učenje zaštićenih autorskim pravom (ne dovodeći u pitanje zakonodavstvo Unije ili nacionalno zakonodavstvo o autorskom pravu).
Takva odredba očito smjera omogućavanju provedbe opt-out opcije iz DAJDT-a, ali je bez daljnjih detalja i konkretizacije autorima beskorisna, dok AI developere ostavlja u nedoumici što se od njih očekuje, ne dajući im istovremeno ikakvu vrstu poticaja da samostalno (po)žele surađivati s autorima na razvoju efikasnog načina za realizaciju opt-out prava.
Malo je vjerojatno da takva odredba smjera obvezivanju dobavljača AI sustava da sastave „popis“ svih ili većine autorskih djela koja su koristili u treniranju svojeg modela, uz navođenje autora istog. Takva bi obveza bila sjajna kada ne bi bila faktički nemoguća.
Naime, prevladavajuće je u svijetu da autorska djela i prava nisu podložna registraciji te da općenito nema sustavnog praćenja podataka o nositeljima prava nad autorskim djelima. Zato je izglednije da se pod sintagmom „staviti na raspolaganje“ krije obveza omogućiti javnosti tj. zainteresiranim autorima pristup i pretraživanje setova podataka korištenih za treniranje svakog konkretnog AI rješenja (op.a. gore spomenuti HaveIBeenTrained ima pristup data setu Stable Diffusiona / LAION). No, i to je za sada samo nagađanje. Nema jasnog odgovora što ova odredba zapravo znači, ali barem politički lijepo zvuči, zar ne?
Output faza i kršenje autorskih prava
Tim istim gore spomenutim prijedlogom članka 28.b. AI Akta predviđa se i uvođenje obveze dobavljača AI sustava da ga razviju na način koji će uključivati zaštitne mjere protiv generiranja sadržaja kojim se krši pravo EU u skladu s općepriznatim najnovijim dostignućima (ne dovodeći u pitanje temeljna prava, uključujući slobodu izražavanja).
Dakle, izvjesno je da se cilja, među ostalim, prevenirati one situacije u kojima bi rezultat korištenja generativnog AI rješenja predstavljao povredu autorskog prava osobe čije djelo je korišteno pri treniranju AI sustava/rješenja.
Dio amandmana 102. Europskog Parlamenta na tekst AI Akta, u segmentu uvodnih odredbi, glasi:
Budući da su temeljni modeli novo dostignuće u području umjetne inteligencije koje se brzo razvija, primjereno je da Komisija i Ured za umjetnu inteligenciju prate i periodično procjenjuju zakonodavni i upravljački okvir takvih modela, a posebno generativnih UI sustava koji se temelje na takvim modelima, koji sa sobom povlače bitna pitanja povezana s generiranjem sadržaja kojim se krši pravo Unije, pravilima o autorskim pravima i potencijalnom zlouporabom. Trebalo bi pojasniti da se ovom Uredbom ne bi trebalo dovoditi u pitanje pravo Unije o autorskom pravu i povezanim pravima, uključujući direktive 2001/29/EZ, 2004/48/EZ i (EU) 2019/790 Europskog parlamenta i Vijeća.
Problematično je što nemamo definirano – koje/kakve su to zaštitne mjere protiv generiranja nezakonitog sadržaja? Na to pitanje čak niti DAJDT nema odredaba koje bi ponudile odgovor.
Naime, u teoriji je moguće da neki od rezultata (output) funkcija generativnog AI rješenja, krši autorska prava u odnosu na ona djela koja su korištena tijekom treniranja tj. obuke konkretnog AI alata. Doduše, malo je vjerojatno da će output biti identičan bilo kojem od inputa.
Izglednije su situacije da će uslijed neovlaštenog korištenja individualnih i originalnih autorskih djela u sklopu training-data-seta doći do stvaranja outputa koji je sličan jednome od onih korištenih za treniranje AI alata. Uoči li se takav sličan ili bitno sličan output, to može biti „alarm“ da je nečije autorsko djelo potencijalno neovlašteno korišteno npr. neovlaštenom preradom ili prilagodbom. I tako od slučaja do slučaja.
No, taj isti output – je li on uopće autorsko djelo, i ako jest, čije? Možemo li i kako njime dalje raspolagati?
Is you is or is you ain’t – work under my copyright
Uvodno u članku je citiran ključan dio definicije autorskog djela iz ZASP-a – originalna intelektualna tvorevina individualnog karaktera. Takva definicija je u skladu s pravnom stečevinom EU koja u centar zaštite, možemo reći, stavlja individualnu tvorevinu izražene originalnosti, nastalu uslijed intelektualnog rada čovjeka i njegovih slobodnih kreativnih odabira u postupku stvaranja. Potonje je zapravo više ili manje obuhvatan sukus onog dostupnog u izvorima EU prava, uključivo u praksi Suda EU.
Primarno, nema konkretnog i općeg odgovora je li rezultat generiranja putem AI alata uopće djelo koje bi se moglo smatrati autorskim. Stoga, logično, nemamo niti konkretnog i općeg odgovora na gornje pitanje o vlasništvu nad tim outputom.
Upitno je hoćemo li te opće odgovore uopće dobiti i je li zapravo potrebno da ih se učini „člancima zakona“. Stoga zasad, jedino što možemo jest pokušati deducirati tj. stvoriti zaključke iz dostupnih propisa i prakse.
Počnimo od toga da bi se većina AI generiranih rezultata mogla svrstati u spektar onoga što EU autorskopravni propisi smatraju da može biti autorskim djelom – jezično djelo kao što je poetska pjesma, glazbeno djelo, vizualno djelo itd. Također, imajući u vidu da generativni AI alati uglavnom nisu u cijelosti samostalni generatori već zahtijevaju određeni vid ljudske intervencije (npr. razvoj AI softvera, nalozi i upute koje korisnik alata daje alatu u procesu generiranja…) – teško bi bilo tvrditi da u procesu generiranja rezultata pomoću AI alata nema intelektualnog rada čovjeka.
Time su prva dva „kriterija“ uvjetno rečeno zadovoljena. No, za ovu je temu ključno pitanje koliki stupanj čovjekova intelektualnog sudjelovanja je dovoljan za potrebe karakterizacije generiranog rezultata kao autorskog djela. I uostalom, kojeg točno čovjeka?
U tome smislu bitno je dotaknuti se srži svakog autorskog djela – originalnosti i njezina izražaja. Originalnost, moglo bi se reći, proizlazi iz kreativnog procesa stvaranja. Ona, za potrebe kvalificiranja nečeg kao autorskog djela, mora biti u tome na neki način izražena.
Zašto bi netko razvijao umjetnički stil ako zna da će mu ga AI “oteti”?
Kao go-to izvor prava za razmotriti aspekt originalnosti djela kroz prizmu generativnih AI alata, često se u literaturi spominje presuda donesena u postupku C-145/10 Eva-Maria Painer v Standard Verlags GmbH. Naime, u sklopu te presude razmatrano što to znači kreativan izbor autora i od kojih se sve faza sastoji kreativan proces stvaranja autorskog djela – od ideje do rezultata.
Dok god ne govorimo o AI alatima koji praktično ne ostavljaju korisniku ikakve kreativne slobode u procesu stvaranja već je na njemu samo kliknuti „generiraj“, odnosno, dok god je AI alat takav da omogućava korisniku kreativnu slobodu, mogli bismo analizirati ovako:
- U prvoj, idejnoj fazi stvaranja, korisnik AI alata s određenom idejom donosi odluku o tome što će to djelo biti, o sadržaju, žanru, stilu, tehnici prikaza, formatu i slično. No, s druge strane AI alata su također ljudski akteri – developeri i druge osobe koje koji programiranjem ili odabirom training-setova određuju granice mogućnosti AI alata. Ako je generirani rezultat doista „djelo“, u ovim okolnostima bi netko mogao pitati nisu li sve ove osobe koautori? Ne ulazeći u pretjerane detalje, koautorstvo je slabo izgledno jer, u pravilu, nijedan od ljudskih aktera s te „druge strane“ ne sudjeluje izravno i baš na generiranju te konkretne/individualne.
- U izvršnoj fazi kreativnog procesa, u smislu pretvaranja ideje u djelo, tzv. AI alate teško je smatrati samo alatima. To zbog njihove sposobnosti da u okvirima gore opisane idejne faze generiraju izuzetno sofisticirane rezultate, a pri čemu prosječan korisnik AI alata neće moći kontrolirati, a vjerojatno niti shvatiti taj proces nastanka tih rezultata. U ovoj se fazi procesa stvaranja korisnik AI alata „udaljava“ od pojma autora jer, mogli bismo reći, gubi dio kontrole nad samim kreativnim procesom stvaranja.
- No, konačno, koliko god generirani rezultati bili sofisticirani, zasad su rijetko takvi da bi bez ikakve redakcije bili spremni za korištenje/objavu ili takvi da onemogućavaju redakciju. Barem kod tekstualnih generiranih rezultata, ne? Tako će generirani tekst vrlo vjerojatno proći kroz barem nekoliko interacija do finalne verzije. U toj redakcijskoj fazi, korisnik AI alata ponovno se može približiti svojim „značajkama autora“.
Moglo bi se stoga zaključiti – da bismo uopće razmatrali pitanje „tko je autor“, rezultat generiran pomoću AI alata mora biti moguće okarakterizirati kao „autorsko djelo“. To trenutno djeluje pravno mogućim dok god je AI alat takav da omogućava korisniku kreativne izbore i aktivan intelektualni doprinos u stvaranju individualnog djela – kako bi ono u konačnici moglo biti originalno i kreativnost korisnika u njemu izražena.
Bude li u pojedinom slučaju tome tako, korisnik AI alata morao bi moći s uspjehom tvrditi da tvorevina stvorena uz pomoć AI alata, jest autorsko djelo – i to njegovo. U suprotnom, ako je AI alat programiran na način da automatski generira rezultat (tvorevinu) bez da je korisnik alata imao ikakvog kreativnog utjecaja na idejni segment i/ili mogućnost kreativne redakcije rezultata – moguće je da se takav rezultat uopće neće moći smatrati „autorskim djelom“ pa stoga neće biti niti prostora za ikoga smatrati autorom.
Tko je autor ovog haikua?
I konačno, čitajući komentare da je poezija još uvijek „tvrd“ orah za generativna AI rješenja – kao materijal za zabavu ili promišljanje o svemu gore opisanom, evo niže prikaz kako smo Chat GPT i ja zajedno napisali haiku o životu u Hrvatskoj. Ne nadamo se Kiklopu i, srećom, nismo ga pisali ni po čijoj narudžbi, stoga ne očekujem svađu oko autorstva s OpenAI-em, a niti ću kome za originalnost morati jamčiti. Uživajte!
Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.
Pravila ponašanja
Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:
Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.
Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.