Stara konzola nadmudrila moderne AI

Atari 2600, konzola iz 1977. sa 128 bajtova RAM-a, iznenadila je svijet veštačke inteligencije nakon što je pobijedila ChatGPT u jednostavnoj partiji šaha. Ovaj neobičan rezultat pokazao je da starinski šah engine može nadmašiti današnje AI modele u određenim zadacima.

Robert Caruso, softverski inženjer koji je organizovao meč, opisao je kako su nove generacije AI pokazale neopravdanu sigurnost. Jedan komentar o OpenAI modelu glasio je: "made enough blunders to get laughed out of a 3rd grade chess club." Ta tvrdnja je potvrdila sumnje u pouzdanost nekih chatbota u igri šaha.

Googleov Gemini najprije se hvalio da neće imati problema protiv Atarija, poredeći se sa modernim šah engineima, ali je naknadno odbio meč: "Canceling the match is likely the most time-efficient and sensible decision." Nakon razgovora, Gemini je priznao da je vjerovatno "hallucinated" i da bi mu duel protiv Atari 2600 bio izuzetno težak.

Ovaj slučaj ističe problem halucinacija i pretjeranog samopouzdanja u AI: balans između sigurnosnih ograničenja i sklonosti modela da izmišlja informacije. Kako bi AI postala pouzdanija, važno je uvesti provjere stvarnosti i ograničenja, pa kako je rekao Caruso: "Adding these reality checks isn't just about avoiding amusing chess blunders. It's about making AI more reliable, trustworthy, and safe — especially in critical places where mistakes can have real consequences."