Tvrdnje i realnost o Grok 4
Elon Musk hvali sposobnosti novog chatbot-a iz xAI i rekao je: "Grok 4 is smarter than almost all graduate students in all disciplines, simultaneously," dodavši da je "the smartest AI in the world." Inteligencija je teško mjerljiva, ali određeni testovi mogu dati važnu indikaciju o stvarnim performansama modela.
Gdje stoji Grok 4 prema LMArena
Na LMArena rang-listi koju je razvio UC Berkeley, Grok 4 je u najnovijim rezultatima zauzeo treće mjesto ukupno i na tekstualnoj generaciji. To je impresivan ishod, ali Grok 4 i dalje zaostaje za naprednijim modelima: Google's Gemini 2.5 je na prvom mjestu, OpenAI o3 i 4o su podijelili drugo mjesto, dok su GPT-4.5 i Grok 4 vezani za treće.
Kontroverze oko arene
Studija konzorcija istraživača predvođena firmom Cohere navodi da LMArena ima "systematic issues that have resulted in a distorted playing field." Istraživači dalje tvrde da se provodilo "undisclosed private testing" prije javnog objavljivanja rezultata, te da su se rangiranja povlačila bez jasnog obrazloženja. Otkriveno je i da verzija Meta-inog LLaMA 4 korišćena u areni nije bila ista kao javno izdana, što je narušilo kredibilitet platforme uprkos izvinjenju koje je uslijedilo.
Zaključak
Grok 4 pokazuje značajan potencijal i snažnu konkurenciju, ali tvrdnja da je "the smartest AI in the world." nije potvrđena ovim podacima. Zbog problema sa metodologijom i manipulacijama testovima, stvarna pozicija Grok 4 među najboljim modelima ostaje nejasna.