GPT-5 razotkriven: Zašto novi OpenAI model halucinira lažne informacije, pogrešne GDP podatke i krive slike

GPT-5 i talas halucinacija

Više od mjesec dana nakon izlaska, GPT-5 i dalje generiše zapanjujuću količinu netačnih tvrdnji. Novi OpenAI model pokazuje učestale halucinacije i daje lažne informacije, što dovodi u pitanje tvrdnje o njegovoj "PhD-level intelligence" sposobnosti.

Primjeri pogrešnih podataka

Korisnik foruma primijetio je da GPT-5 daje "wrong information on basic facts over half the time," uključujući GDP cifre koje su bile "figures that were literally double the actual values." Na primjer, Poljska je u odgovoru predstavljena sa više od dva biliona dolara, iako je njena stvarna vrijednost oko $979 billion.

Zašto LLM halucinira

OpenAI u blogu objašnjava da "Hallucinations persist partly because current evaluation methods set the wrong incentives," i da "While evaluations themselves do not directly cause hallucinations, most evaluations measure model performance in a way that encourages guessing rather than honesty about uncertainty." Drugim riječima, modeli su trenirani da pogađaju umjesto da otvoreno priznaju neizvjesnost.

Eksperimenti i vizuelne greške

Nezavisni ispitivači prikazali su primjere loših rezultata: jednostavne igre, finansijski savjeti i zahtjevi za označene slike su dali smiješne ili neutemeljene odgovore. Jedan test sa zahtjevom "posse" umjesto "possum" proizveo je pogrešno označene delove, a naredni zahtjev "a posse with six body parts labeled" takođe je dao netačne, zbunjujuće slike. Takve greške pokazuju da GPT-5 halucinira kako u tekstu, tako i u vizualnim prikazima.

Zaključak

Jasno je da GPT-5 nije nepogrešiv i da i dalje halucinira i daje lažne informacije. Najmudrije je uvijek provjeravati činjenice i ne prihvatati odgovore chatbota bez dodatne verifikacije.

GPT-5 razotkriven: Zašto novi OpenAI model halucinira lažne informacije, pogrešne GDP podatke i krive slike

GPT-5 i talas halucinacija

Primjeri pogrešnih podataka

Zašto LLM halucinira

Eksperimenti i vizuelne greške

Zaključak

Postavi komentar

Najnovije Vijesti

Šok u Partizanu: Mika Murinen neće igrati protiv Dubaija u prvom kolu Evrolige

Atletiko razbio Real 5:2 u madridskom derbiju — Ćabi Alonso o teškom i zasluženom porazu

Krstovdan na Krstovoj Gori u Tesliću: Časni krst visok 33 m i manastir privukli narod

Bob Mekjuen: Republika Srpska i Milorad Dodik pod ogromnim pritiskom — Tramp i SAD mogu obnoviti Dejton

Nevjerovatno 6:4 u Menhengladbahu: Ajntraht Frankfurt deklasirao Borusiju u golijadi Bundeslige

Upozorenje: Promjenljivo i svježije vrijeme u BiH — Kiša, sjeverni vjetar i temperature do 22°C

Tehnologija

Prva AI ministarka Diella izazvala haos u albanskom parlamentu — Hoće li zaustaviti korupciju u javnim nabavkama?

Mark Zuckerberg Ponižen na MetaConnect 2025: AI Ray-Ban naočale zakazuju tokom demo prezentacije

OpenAI priznaje: pokušaji da se izbaci "scheming" iz GPT-5 naučili su AI kako da bolje obmanjuje

Nevjerovatna promjena polarizacije kod supermasivne crne rupe M87* otkriva skrivena magnetska polja

Kako AI automatizacija mijenja tržište rada: Jerome Powell i utjecaj na mlade radnike, kamatne stope i rizik stagflacije

Microsoft u krizi: Masovna otpuštanja, ogromna AI ulaganja i Satya Nadella pod pritiskom

SMS blasteri s lažnim 4G/2G baznim stanicama: Masovne SMS prevare koje napadaju mobilne telefone

O nama

Pratite nas na