OpenAI i GPT-5 pod svetlima, ali sa velikim greškama
OpenAI je predstavio GPT-5 tokom livestream prezentacije, ali lansiranje je pratilo niz grešaka koje su razorile povjerenje. Grafikon koji je trebalo da pokaže superiornost GPT-5 je prikazao netačne barove: rezultat 52.8% za GPT-5 prikazan je većim od 69.1% za prethodni model, dok je bar od 69.1% imao istu visinu kao bar od 30.8% za GPT-4o. Ove greške u grafikonima šokirale su publiku i brzo se proširile društvenim mrežama.
Problemi sa grafikonima i generisanjem slika i mapa sugerišu da GPT-5 još uvijek ima ozbiljne slabosti. Korisnici su prijavili da su mape i etikete gradova bile totalni nonsens, što dodatno ukazuje na probleme u generisanju vizuelnih prikaza. Te greške u grafikonima i mapama podstiču pitanja o halucinacijama modela i kvalitetu trening podataka.
OpenAI je naknadno ispravio grafikone u zvaničnom saopštenju, ali originalni snimci ostaju dostupni u livestream arhivi. Altman je pokušao da umanji incident citatom: "[W]ow a mega chart screwup from us earlier," he tweeted, in his typical lower-case patois. "wen GPT-6?!"
Ovo otkriće naglašava koliko su kritične provere i validacija pri prezentaciji performansi GPT-5. Dok OpenAI radi na ispravkama, pitanja o pouzdanosti GPT-5, halucinacijama i preciznosti grafikona ostaju u fokusu javnosti.