Kako je hrvatski trojac analitičara predvidio Trumpovu pobjedu uz Facebook i Twitter

Sviđa vam se članak?

Preporučite ga prijateljima i kolegama putem društvenih mreža!

Hrvatski računarac, (astro)fizičar i politički ekonomist ispitaju nekoliko stotina ljudi na društvenim mrežama i predvide pobjedu Donalda Trumpa na američkim izborima? Ovaj pomalo šaljivi i daleko pojednostavljeni prikaz događaja prije nekoliko mjeseci činio bi se prilično nevjerojatnim, ali tako je bilo – britansko-hrvatski startup Oraclum Intelligence Systems uspješno je predvidio da će Hillary Clinton u konačnici imati više glasova, a opet izgubiti izbore, što su se tek rijetki usudili izreći. Jučer su održali predavanje u agenciji Bruketa&Žinić OM, gdje su objasnili i kako su do rezultata došli, što je bila i prilika da objavimo intervju s njima.

Vuk Vuković na jučerašnjem predavanju u agenciji Bruketa&Žinić OM.

Vuk Vuković na jučerašnjem predavanju u agenciji Bruketa&Žinić OM.

Kad su Mili Šikiću, Dejanu Vinkoviću i Vuku Vukoviću nakon pobjede Donalda Trumpa počele stizati čestitke sa svih strana, osjećaji su im bili podvojeni. S jedne strane, bili su sretni jer se njihov model na kojemu su dugo radili pokazao točnim, s druge su bili djelomično šokirani jer su i sami, pod utjecajem medija, bili pod dojmom da će pobijediti Hillary Clinton. No, njihova znanstvena metoda pobijedila je mnoštvo prognozera i  stručnjaka koji su do tada imali velik uspjeh u predviđanju američkih izbora, jer se u konačnici ispostavilo da su oni bili u krivu, a hrvatska tvrtka s adresom u Cambridgeu – u pravu.

Uspješni su bili i u predviđanju rezultata takozvanog Brexita, a svoju su metodu usavršavali na hrvatskim izborima 2015. i 2016. godine nakon čega su došli do zaključka o pogrešnom načinu uzimanja uzorka. Kako je Vuk pojasnio, “uzorak mora imati jednako zapostavljene sve strane”.

Samo 3 ključna pitanja za 450 ispitanika

No, kako su uopće došli do tih rezultata? Objašnjenje je, barem naizgled, jednostavno. Njihova se anketa odvija samo putem interneta, što znači da moraju sami izgraditi vlastitu bazu ispitanika, kojoj postavljaju tri ključna pitanja.

Uz standardno “za koga ćete glasovati” pitamo ih za koga misle da će pobijediti u njihovoj državi ili regiji te kako misle da će ostali u njihovoj državi odgovoriti na to isto pitanje. Metoda se dakle temelji na konceptu mudrosti masa (wisdom of crowds). To je ujedno i glavni razlog zašto ona radi i na relativno malom uzorku (u ovom slučaju 450 ispitanika). Za razliku od anketa čija se procjena mora temeljiti na reprezentativnom uzorku kojeg oni moraju prilagođavati s vrlo limitiranim brojevima ispitanika, kod nas je samo bitno uloviti politički moment – drugim riječima “kako narod diše”.

Iako se anketiranje putem društvenih mreža čini kao pravom zamkom za nailazak na “društvene balončiće”, Vuk objašnjava kako su tome doskočili. Sam koncept mudrosti masa nije često dovoljan za preciznu predikciju, napominje, jer se ljudi često druže samo s istomišljenicima, što ih dovodi do pristranosti. Njihova pak metoda taj problem rješava tako da gleda društvenu mrežu ispitanika, odnosno kako su glasali njihovi prijatelji na društvenim mrežama.

Naravno, svi ti podaci su anonimizirani i mi ne možemo znati tko je kako glasao, već samo vidimo s kakvom grupom ljudi pojedina osoba ostvaruje interakciju. Oni koji se druže u heterogenim grupama, izloženi različitim mišljenjima, su u pravilu bolji prognozeri, dok oni u homogenim balončićima su loši prognozeri. Mi možemo mjeriti tu pristranost i time prilagođavati našu predikciju.

Medijska pristranost bila je faktor i prije pojave društvenih mreža

Što se tiče “odgovornosti” društvenih mreža za ovakav rezultat izbora, posebice Facebooka, Vuk se ne slaže s tezom da su one u potpunosti krive za njega. Naime, napominje kako društveni baloni nisu nastali ni s društvenim mrežama ni s internetom.

Ljudi su i prije tražili izvore informacija koji odgovaraju njihovom svjetonazoru i, ako su htjeli, družili su se samo s grupama istomišljenika. To što im Facebook ili neka druga mreža servira vijesti koje žele vidjeti, rezultat je prije svega njihove potražnje za takvim vijestima. Uostalom, medijska pristranost bila je faktor puno prije pojave društvenih mreža.

U Americi je dobar primjer Fox Newsa na izborima 2000., gdje postoje znanstveni radovi koji pokazuju kako su naselja koja su bila izloženija gledanju Fox Newsa uoči izbora imala veći odaziv i glasovanje za Busha. Osim toga, Ameriku karakteriziraju desetljeća rasta nejednakosti, stagnacije plaća, a da ne govorimo o radikalizaciji društva u posljednjih 8 godina i pojavom stvari poput Tea Party pokreta. Korisnici kreiraju sadržaj društvenih mreža – one će samo biti preslika stanja u društvu, nikako njegov uzrok.

Ipak, iako su u slučaju referenduma u Velikoj Britaniji te predsjedničkih izbora u SAD-u njihova predviđanja bila poprilično precizna, kod hrvatskih je izbora bilo odstupanja. Vuk pojašnjava kako je riječ o drugačijoj vrsti izbora – u prva dva slučaja izbor je bio gotovo binaran (posebice u Velikoj Britaniji), dok se u Hrvatskoj radilo o višestranačkim izborima, što je dodatno zakompliciralo stvari. Nakon predikcije u Hrvatskoj model se dodatno usavršio, ističe, a testirat će se i dalje.

Izazovi vizualizacije podataka

Važan dio cijele Oraclumove priče čini i vizualizacija podataka, a za tehnički dio zadužena je tvrtka UX Passion, čiji CEO Vibor Cipan, koji je uz kolege Mladena Panića, Andreja Antolovića i Darka Čengije radio na projektu, ističe kompleksnog zadatka koji je bio pred njima.

Naime, nije se radilo samo sa statičkim podacima, već se moralo učestalo provjeravati rezultat modela i predikcija te prikazivati te rezultate. Osim grafičkog prikaza, podaci su imali i geolokacijski element – tako da su postojali podaci za svaku pojedinu saveznu državu. Prikazivani su podaci o predviđenom postotku osvojenih glasova za glavne kandidate kao i vjerojatnost pobjede pojedinog kandidata u pojedinoj saveznoj državi, te, konačno, vremenska dinamika i promjene istih podataka.

Poseban izazov predstavljao je prikaz podataka i na mobilnim uređajima, nastavlja, Bilo je potrebno optimizirati sam prikaz kao i metode prikaza podataka te upravljanje elementima poput grafova ili mapa. Rezultat svega je web aplikacija s backendom na kojem se odvijaju kalkulacije i same predikcije rezultata te dijelom orijentiranom prema samim korisnicima gdje se rezultati prikazuju. A kad te rezultate podijelite na društvenim mrežama, to nije samo obično ‘šeranje’.

Ne radi se o pukoj mogućnost dijeljenja sadržaja na tim mrežama (taj je dio trivijalan!). Stvar je, naime, da se podaci o social graphu i odnosima među pojedinim korisnicima i njihove predikcije rezultata uzimaju u obzir i čine osnovicu predikcijskog modela.

Ankete su bitne za praćenje trendova, ali mogu se koristiti za predviđanje samo ako su dobre

Za kraj, Vuković se jučer osvrnuo i na problem s anketama, koje se i dalje redovito koriste. Kako kaže, one nisu predviđanja, one daju presjek stanja u točki vremena i bitne su za praćenje trendova.

Iz trendova se može raditi predviđanje, ali samo ako su ankete dobre.

Svoj model Oraclum će nastaviti validirati na francuskim izborima u svibnju i njemačkima u listopadu, a u planu su i drugi, ovisno o mogućnostima financiranja. Kako kažu za sebe, startup su koji još uvijek radi na razvijanju komercijalne djelatnosti, odnosno svih mogućih primjena ovakve metode predikcija. Kao jedna od glavnih prednosti ističu se precizni rezultati na malom broju ispitanika – a procjena pobjede Trumpa u portfelju u ovom slučaju nikako ne može odmoći.