Modrić, papige i printeri znaju da nas roboti neće zamijeniti

Modrić, papige i printeri znaju da nas roboti neće zamijeniti

Poplava GPT-4 gurua i Microsoft vs Google utrke stvara dojam friške revolucije, no umjetna inteligencija već desetljećima skriva iste kosture u ormaru. Dobrih ideja i rješenja ima mnogo. Lovaca u mutnom vjerojatno i više. Pitanje je samo - tko će biti glasniji?

Samo je par dana trebalo da ishitreni Bing i Bard unište snove o nadnaravnim robotima koje su SciFi autori kovali desetljećima – recimo komandant Data koji je izbacivao nepogrešive Sherlock Holmes dedukcije iz pozitronskog mozga. Ili pak WALL-E koji je ganjao simpatiju kroz cijelu galaksiju samo na svojim mikro gusjenicama <3

Čak je i Terminator Arnie bio ljubazan kada je 1991. deklasirao helikopter i tucet policijskih vozila, bez da (namjerno) okrzne ijednog plavca. “Human Casualties: 0.0”

Fast forward na 2023. i nalazimo se u situaciji gdje GPT modeli mogu zaboraviti na takvu razinu Schwarzeneggerove izvrsnosti. U moru primjera su isplivale nogometne analize gdje GPT-3.5 kao temelj Modrićeve virtuoznosti navodi vrhunsko igranje lijevom rukom. Također me čudi što Butković i kult plave kamenice nisu opleli po robotima. Naime, OpenAI sustav ponešto zna o kuhanju, no izostavlja spomenuti da nam je za sarmu potrebno i zelje.

A kad smo već kod recepata – GPT-4 odbija asistirati ako ga zatražite opis molotovljevog koktela ili nedajbože smrtonosne gramaže ricina. “Prompt inženjeri” ne samo da su našli način kako da ga “jailbrejkaju”, već to rade toliko nemilosrdno da se Isaac Asimov i njegova tri zakona opasno rotiraju u grobu.

Niz grlo nam se servira da su gornji primjeri samo rani bugovi tj. rješivi izazovi; no kroz članak ću opisati da oni demonstriraju dublju problematiku polja umjetne inteligencije. Polja koje već dugo miriše na namjernu marketinšku mistifikaciju, a ponekad i na slijepu tehnološku ulicu.

Forma kolumne doduše nije ambiciozna da pokrije sva goruća pitanja, ali to ne znači da ne možemo deklasirati par mitova along the way. Počevši od toga kako umjetna inteligencija uopće radi.

Transformeri (ali ne oni iz filmova)

U moru medijskog šok-bombardiranja čitamo natpise da ChatGPT ima 175 milijardi, Google PaLM 540 milijardi, a novi GPT-4 čak bilijun parametara (!?).

Novinari vole prenijeti citat i od vidno uzbuđenog stručnjaka koji uspoređuje umjetnu inteligenciju s napaćenim ljubimcima  … “GPT-4 ima parametara (sinapsi) kao i mozak divlje purice! Zasada se ne morate bojati za radna mjesta, ali…”.

O čemu se ovdje zapravo radi? U samom AI srcu nalaze se umjetne neuronske mreže – skupine matematičkih jednadžbi čiji je izgled i kalkulus inspiriran iz načelnog rada bioloških neurona.

Pišem “inspiriran” i “načelnog” jer takve usporedbe dižu preostalu kosu na glavi kognitivnih znanstvenika – direktne komparacije pravih i umjetnih neurona nemaju veze s mozgom (ha!) iz jednostavnog razloga što mi u globalu niti ne znamo kako inteligencija uopće radi.

No ono što znamo je da neuronske mreže i slični matematički umaci pripadaju domeni prediktivne statistike.

Google i Facebook foto tagiranje nam je vjerojatno bio prvi en face susret s umjetnom inteligencijom – korisnik bi uploadao fotografiju i na njoj označio par prijatelja. Čim biste više “tagirali” slike to bi aplikacija predložila tagove i na drugim fotografijama. Proces se zove nadzirano strojno učenje pošto korisnik označava na kojim pixelima je Marko, a na kojim pixelima Ivana.

S druge strane, GPT koristi kombinacije nadziranog, ali i nenadziranog strojnog učenja.

Sustavu se učita baza tekstova (što OpenAI plaća cca 8000 dolara za svakih milijun stranica), a neuronska mreža potom skenira odnose između slogova, riječi i rečenica. Prezime Modrić je u online korpusu često smještena uz izraze “šut lijevom, igranje rukom, plaćanje poreza” pa robot iz tog razloga zna izraziti Lukinu, a ne vašu virtuoznost. Naravno, uz neku dozu točnosti.

Iznimka testira pravilo

Prevedeno, takvi algoritmi nemaju eksplicitno znanje ovoga svijeta već zaključke aproksimiraju na temelju brute-force matematike marinirane u velikim podacima.

Posljedica statističke arhitekture je da neuronska mreža ne zna govori li istinu ili ne. To jest, već i ptice na grani znaju da u takvim algoritmima postoji određena razina greške, no manje je očito da sustav radi greške koje niti sam čovjek ne bi napravio.

GPT-4 se neće libiti namjerno lagati ljudima, a sposoban je zabrazditi i u bukvalno izmišljanje križarskih pohoda, Iranskih reaktora, ali i lažnih biografija. Narod bi mu rekao da “prodaje bozu”, no inženjerima je ta sustavna značajka već debelo poznata i zove se “stochastic parroting”.

Papagajanje i haluciniranje algoritma nam može biti slatko kada AI detektira uredskog psa umjesto ljudske noge; no urođeni porok golog upucavanja podataka je što će neuronska mreža uprosječiti (homogenizirati) dobre i loše strane koje ti isti podaci sadržavaju – pristranost, seksizam, dezinformaciju, ali i rasizam što se moglo vidjeti u poznatom “Jacky Alcine VS Google Photos” slučaju iz 2015. gdje su osobe crne boje kože označene kao gorile.

Osam godina kasnije i digitalni divovi priznaju da ne mogu riješiti problem “fer” podataka. Google je ručno morao uklanjati “majmunski” tag iz sustava, a sličan gorila udes dogodio se i Facebooku 2021. Po kuloarima kruži priča da je OpenAI potrošio 10 milijuna dolara kako bi Kenijci u pozadini tipkali odgovore i s time “ugladili” cijelo korisničko iskustvo. Očigledno uzalud jer ChatGPT kao AI sustav današnjice generira isti rasističko-stereotipni mulj; kako kroz tekst, tako i kroz programski kod.

Naivni investitori su možda u šoku, no direktna ljudska intervencija uobičajena je AI praksa. Mnogi VC pitch deckovi skrivaju da u pozadini strojnog stoji i “ljudsko učenje” tj. manualni “sweatshops” rad. Recimo, Nate (eCommerce aplikacija) je promovirala svoj inteligentni checkout, no koji je u mašinskom srcu ugostio Filipince koji su prekucavali podatke za narudžbu proizvoda. Pogotovo onih koji sadržavaju tonu iznimaka.

Bazični razlog ljudske intervencije tj. problem sa opisanim primjerima i “iznimkama” je što su one tamna tvar okoliša – ima ih bezbroj i u neograničenim formama, a unaprijed su naravno 🙂 nepoznate. Samim time, strojno učenje i slični koncepti su po definiciji odličan alat za predviđanje budućnosti, no samo one budućnosti koja izgleda kao povijest.

Algoritamski folklor

Kako bi povećali točnost i smislenost sustava, inženjeri treniraju neuronske mreže za jedan specifičan zadatak. Ako žele uhvatiti prijevaru na kreditnoj kartici (detekcija anomalije), taj AI neće moći raditi kao jezični model (predviđanje sljedeće riječi). Ako odluče izgraditi program koji razdvaja pokvarene tikvice (klasifikacija), taj algoritam neće moći taktizirati oko sljedećeg poteza na GO ploči.

Opisano se zove Narrow AI ili Weak AI, a glasniji dio industrije nas u algoritamskom folkloru uvjerava da ćemo kroz stalan rast postojećih koncepata stići i do potpune autonomne vožnje, humanoidnih multipraktik robota i slične Artificial General Intelligence (AGI ili Strong AI) koja će se umjesto nas vrtiti na uredskim stolicama.

Na stranu tabu tema da su postojeće AI prakse posljedica slučajne hardverske lutrije; a ne ciljanog razvoja; opisana hipoteza skale ima tri realna problema.

Za početak, direktna mjerenja pokazuju da veće ne znači nužno i bolje. Uz to, gornji problemi s iznimkama i papagajenjem će ostati prisutni pošto je uvećana aproksimacija još uvijek – aproksimacija. Štoviše, udes s Bingom (koji koristi GPT-4) pokazuje da je veće modele teže kontrolirati i uglađivati.

Što nas pak vodi do drugog problema.

Postojeći smjer izgradnje glomaznih “black box” sustava nije u skladu s postojećom regulativom i tržištem koje zahtijeva tzv. objašnjive algoritme (eXplanable AI),

Apple je nedavno u Parizu morao elaborirati način rada mreže koja odlučuje o serviranju oglasa. Američki suci već najavljuju da bi Microsoft, Google i silicijska klika trebala biti odgovorna za “output” svojih robota. I sam GDPR nam začudo ovdje drži leđa pošto mi kao EU građani imamo pravo dobiti objašnjenje rada bilo kojeg inteligentnog sustava (s kojim su naši podaci bili u doticaju).

Nažalost, OpenAI je s lansiranjem GPT-4 sustava otišao u kontra smjeru i namjerno zakamuflirao stvari, skrivajući cijeli model rada – što ne samo da je problematično oko analize ChatGPT outputa; već dodatno centralizira AI industriju (koja je ionako previše okrupnjena oko MAAMA igrališta).

Posljedice neobjašnjivog algoritma se najbolje mogu vidjeti u misterioznom GPT-3.5 slučaju, gdje su OpenAI inženjeri odlučili napuniti sustav s arhivom Reddit foruma. What could go wrong?

Čudnovata odluka da se Reddit koristi kao podloga za strojno učenje zapravo je posljedica nedostatka kvalitetnih online materijala – što je ujedno i treći problem hipoteze skale.

Epoch AI istraživači su pokazali da će drugorazredni tekstualni materijali (njihove riječi :)), poput gornjeg Reddita, biti iscrpljeni do 2050. godine. No hitniji problem je što će AI sustavi iscrpiti kvalitetni online fundus do 2026. godine.

Da budemo fer – GPT i slične crne kutije nesumnjivo su impresivna i široko korisna dostignuća tisućljeća. Međutim, ispada da s takvim sustavima zapravo dobivamo tisuću digitalnih praktikanata koji rade za sitniš, brbljaju cijeli dan i kojima stalno moramo visjeti iznad glave.

A čak i da nekom magijom dođemo do mega aproksimatora koji će u jednom dahu istipkati groundbreaking romane; aktualni jezični modeli, strojno učenje i neuronske mreže same po sebi ne mogu riješiti izazov generalne umjetne inteligencije. Pravi razlog tome je što postoji pet općenitih situacija pred kojima roboti drhte, a koje mi uzimamo zdravo za gotovo. To su redom: apstrakcija, zdrav razum, kompozicija, faktualnost i memorija naučenog ponašanja (katastrofično zaboravljanje).

Može li papiga zakočiti na zebri?

Tech industrija već desetljećima održava toplo-hladni odnos s tih pet izazova – projekt CYC od 1984. pokušava izgraditi eksplicitnu bazu znanja (faktualnost) dok Wolfram Alpha, uz to što ima direktna znanja, sadržava i kompoziciju objekata pa može pouzdano tvrditi da se Fićo sastoji od šarafića. No spomenuta hardverska lutrija nije favorizirala takve pristupe pa su veće investicije izostale.

Nije pomogla niti sveprisutna inženjerska migrena. Ispada da ugradnja direktnog znanja i rezoniranja nije skalabilna priča, a uz to i puca pri prvom doticaju s prirodom stvari – što je najbolje iskusio IBM Watson koji je nakon par vizita završio na reciklaži. Građevinski sektor u svojih više tisuća godina postojanja nije uspio modelirati općenito ciglanje kuća; a znakovita je i priča o printerima koji već 70 godina muku muče s matematikom zaglavljivanja papira 🤷

Dosadna “caka” kod ugrađivanja eksplicitnog znanja u digitalne sustave je što uz njih moramo simultano ugraditi i barem nekakav motor apstrakcije i zdravog razuma; a takve matrice ne znamo niti osmisliti, a kamoli izračunati.

Milka bezbrižno demonstrira gornje točke, ali i nešto što nazivamo paradoks gospodina Moraveca – on piše da ono što je računalima lako će nama biti teško; a da ono što je računalima teško će nama biti lako.

Ograničenja jedinica i nula te posljedični paradoks smetnja je AGI vizionarima i valuaciji njihovih kompanija pa su odlučili izvrnuti Moraveca naglavačke – i to u jednom ispraznom narativu da su ljudi loši vozači, lijeni copywriteri i aljkavi inženjeri. To jest da nam rad, kreacija i rekreacija ne ide baš lako kako mislimo.

Takvi nihilistički stavovi kompletne zamjene ljudi tehnologijom ne samo da vode industriju u slijepu ulicu (touringova zamka), već su temeljeni na krivim ekonomskim pretpostavkama i lažnim argumentima.

Uzmimo za primjer vožnju automobila gdje se na 200 milijuna prijeđenih kilometara dogodi samo jedan fatalni slučaj. Vozači školskih autobusa su još impresivniji jer agregirano odvoze do 800 milijuna kilometara bez ijednog smrtnog slučaja.

Najveća je ironija što pijemo isprazne tvrdnje o “nedostatnim ljudima” od iste one tehnološke oligarhije koja je uspjela pokakati društvene mreže, smislenu kripto regulaciju i digitalnu privatnost; koja gazi djecu na zebrama i koja već desetljećima mulja o mogućnostima tehnologije.

Što i nije čudno kada uzmemo u obzir da živimo u zlatnom dobu bullshitanja gdje se bahatost nagrađuje, umjesto da se propituje.

A nigdje ta bahatost i pretjerana simplifikacija nije toliko prisutna koliko u području umjetne inteligencije gdje se tvrdi da nam AGI stiže “kroz 5 godina” – i tako već 80 godina.

Za primjer ne moramo ići dalje od zagrebačkih robotaksija koji – u gradu u kojem nedostaje žbuke, vrtića i nepropusnih vodovodnih cijevi – prže 200 milijuna javnih eura.

Kada maknemo na stranu pubertetske izjave da će robotaksiji omogućiti vožnju svima pa čak i školarcima (jer da, baš bi prvašići trebali biti pokusni kunići robotima); unutar državnog NPOO dokumenta ponosito piše da je potpuna autonomna vožnja “u najvećoj mjeri spremna” što je toliko velika neistina, da je vrhuška iz DORH-a već trebala našiljiti olovčice.

Ne brinite, AI gurui se tek zagrijavaju

Srećom, dobar dio AI razvoja usmjeren je na potpomaganje ljudskog rada što nas vraća na glavno pitanje teksta – kako da mi kao programeri, dizajneri, freelanceri, agencijaši ili produktaši gledamo na AI i moguću dnevnu rutinu?

Starija ekonomska dogma tvrdi da augmentacija rada ima veći benefit nego puka zamjena ljudi, a jesensko GitHub istraživanje osvjetljava detalje – inženjeri su uz pomoć Copilota isprogramirali testni zadatak za 55% manje vremena od kolega kojima Copilot nije bio dostupan.

Alati poput Copilota pospješuju završavanje zadataka za cca 10%  te zadržavanje voljene nam “zone” kod čak 73% ispitanika – ostavljajući inženjerima više vremena za: produbljivanje znanja, povećanje kvalitete koda, ali i prijeko potrebnu suradnju s UX kolegama o čemu je Nenad već tipkao.

Pročitajte i twitter thread koji demonstrira rađanje kompletno nove kategorije storytellinga. Umjetnu inteligenciju su počeli koristiti i za heklanje “ukletih” uzoraka ili pak generiranje beskrajnih epizoda Seinfelda. Također, Antonija i Marko su pisali o sveprisutnom trendu stvaranja novih vrsta online pretraga; a sve navedeno naznake su proširivanja kreativnih i online industrija.

Produbljivanje i proširivanje branše uslijed tehnološkog napretka je nešto što se u ekonomiji opisuje i kroz Jevonov paradoks. On kaže da se potreba za resursima diže uslijed uvođenja novih alata i efikasnosti što prevedeno znači da bi potreba za programerima, copywriterima i dizajnerima mogla rasti; ali i da GPT gurui neće tako skoro na godišnji.

Jevon podrazumijeva grljenje novih alata (poznajete li računovođu koji ne zna Excel?), no upravo u smislenom korištenju tehnologije leži zadnja poanta da mi kao nositelji industrije moramo biti glasniji o realnim mogućnostima iste. Umjetna inteligencija suštinski ne demonstrira naznake ljudske kognicije – dovoljno velika neuronska mreža moći će do neke mjere imitirati što ljudi trenutno rade, ali neće moći osmisliti sve što je moguće napraviti.

Oponašanje naših vijuga je stoga besmisleno jer se najvažnije i najkorisnije AI značajke ionako već nalaze direktno u računalima. Istina, novi fascinantan moment je što su nam alati preko noći postali pametni, ponekad i dovitljivi; a ono što postaje jasno jest da ćemo mi koji koristimo AI sustave morati biti oboje. No upravo smo se kroz umjetne pristupe, alate i tehnologije uspjeli izdići iz onoga što je moguće – to jest, i mi sami smo postali mudriji, kreativniji i pametniji, kako u fizičkom, tako i u virtualnom svijetu.

Sukladno članku 94. Zakona o elektroničkim medijima, komentiranje članaka na Netokraciji dopušteno je samo korisnicima koji ostave svoje ime i prezime te mail adresu i prihvate pravila ponašanja.

Pravila ponašanja

Na Netokraciji za vas stvaramo kvalitetan, autorski potpisan sadržaj i zaista se veselimo vašim kvalitetnim, kontruktivnim komentarima. Poštujmo stoga jedni druge prilikom komentiranja, kao i Zakon, držeći se sljedećih pravila ponašanja:

  • Ne budite 💩: Nema vrijeđanja, diskriminiranja, ni psovanja (osim ako nije osobni izričaj, ali onda neka psovka bude općenita, a ne usmjerena prema nekome). Također, upoznajte se sa stavkom 2. članka 94. Zakona o elektroničkim medijima prije no što ostavite komentar.
  • Samo kvalitetna rasprava, manje trolanja: Ne morate se ni sa kim slagati, ali budite konstruktivni i doprinesite raspravi! Svako trolanje, flameanje, koliko god "plesalo" na granici, leti van.
  • Imenom i prezimenom, nismo Anonymous 👤: Autor sadržaja stoji iza svog sadržaja, stoga stojite i vi iza svog komentara. Koristimo ime i prezime te pravu email adresu.

Kako koristimo podatke koje ostavljate? Bacite oko na našu izjavu o privatnosti.

Sve ostale komentare ćemo s guštom spaliti, jer ne zaslužuju svoje mjesto na internetu.

Komentari

  1. Lovro

    Lovro

    21. 03. 2023. u 2:03 pm Odgovori

    Boze glupog li stajalista. Dajte javite googlovima i OpenAI-jevima ovog svijeta, DARPAma, BDevima, Intelima i IBMovima, ABBovima i KUKAma … nema kruha u umjetnoj inteligenciji, pitajte Kresu iz donje spickovine, roboti nikad zamjenili covjeka, nisu i nece, i ne dogada se to svaki dan.

    • Ana Marija Kostanić

      Ana Marija Kostanić

      21. 03. 2023. u 2:27 pm Odgovori

      Dragi Lovro, hvala na komentaru – to je i poanta teksta te se zapravo slažete s “Kresom iz donje spickovine”. Ostavljam vam komentar samo da bude zaštitna mrežica za ostale koji nalete i pomisle isto. 🙂

        • Ana Marija Kostanić

          Ana Marija Kostanić

          22. 03. 2023. u 3:13 pm Odgovori

          Ispravka mog navoda: nisam valjda uhvatila taj fini sarkazam jer ne vidim ništa proročanski u tome što navedene tvrtke i institucije skaču na sljedeći novi tech trend. To ne znači da AI isn’t here to stay i da neće svašta razvaliti po putu, ali ako se vaše mišljenje nakon svih detalja u ovom tekstu svodi na sarkazam “nema kruha u umjetnoj inteligenciji” onda nisam samo ja pomiješala kruške i jabuke. 🙂

Odgovori

Tvoja e-mail adresa neće biti objavljena.

Popularno

Ekskluzivno

57hours Viktora Marohnića narastao 4 puta i osigurao još 2,75 milijuna dolara

U ekskluzivnom intervjuu za Netokraciju, suosnivač brzorastuće avanturističke platforme Viktor Marohnić, sa svojim investitorima, otkriva planove.

Tvrtke i poslovanje

7 savjeta za učinkovitu izradu poslovnog plana (posebno za one koji nemaju vremena)

Nisu bez razloga velikani povijesti od Sun Tzua do Dwight D. Eisenhowera pričali o planiranju kao o svetom gralu uspjeha - i ne stoji bez razloga ona narodna: dobra organizacija je pola posla.

Novost

Peta kriptomarka Hrvatske pošte su neponovljivi profesor Baltazar i njegovi izumi

Peto izdanje kriptomarke, koja dolazi u analognom i digitalnom obliku, Hrvatska pošta pustila je u optjecaj!

Što ste propustili

Tvrtke i poslovanje

Sretan mu 25. rođendan: Kako smo počeli koristiti Googleove proizvode – i zašto (ne)ćemo nastaviti?

Povodom Googleovog rođendana prisjećamo se njegove prošlosti, nepobitnog utjecaja na sve digitalno što danas radimo, ali gledamo i u blisku budućnost koju će obilježiti dvije ključne riječi - umjetna inteligencija i monopol. Nismo propustili priliku ni nostalgično se prisjetiti pozivnica za Gmail, Googleovih pokušaja da napravi društvenu mrežu ili prvih susreta s Googleom, što je za neke zapravo bio YouTube.

Novost

U ZICER-u startupe čeka 150.000 eura, a prijave za akceleracijske programe traju još samo ovaj tjedan

Vodeći hrvatski startup hub ZICER otvorio i program za uspješno lansiranje na globalno tržište.

Umjetna inteligencija

500 tisuća korisnika koristi tehnologiju ovog hrvatskog AI startupa

S vremena na vrijeme, pojavi se neki startup koji marljivo radi "ispod radara", a onda odluči podijeliti svoju priču. Prvi donosimo intervju s TensorPixom koji od nedavno broji preko pola milijuna korisnika.

Izvještaj

Lekcije inženjerke iz Shopifya: kako koristiti AI za brži, bolji i lakši razvoj softvera?

Umjetna inteligencija i inženjeri. Nekada se vole, nekada mrze, ali činjenica je da AI inženjerima može olakšati pisanje koda... (ako i sami znaju što rade).

Tvrtke i poslovanje

Sofascore i Span: Zašto se nismo prodali? Jer nam to ne treba – ako imaš tri auta, možeš voziti samo jedan.

Investicije i preuzimanja domaćih tvrtki glavne su teme naše male poduzetničke scene, ali koliko god se pričalo, često tema o neovisnosti ostane postrani. Srećom, ove godine se otvorila na 16. Weekendu.

Programiranje

“Design Handoff” je proces zbog kojeg developer i dizajner ne moraju imati “standoff”

Predaja bilokakvog projekta ne završava s vašom točkom na kraju - nego svih kojih se taj projekt usko tiče. Uz Neuralab prolazimo kako od “ja sam svoje riješio” doći do kvalitetnog, strukturiranog “design handoffa” koji će značajno olakšati život svima uključenima: dizajnerima, developerima, PM-ovima, klijentima…