Hitno upozorenje: 40 istraživača iz OpenAI, DeepMind i Meta – Chain-of-Thought (CoT) prijeti da izgubi transparentnost i sigurnost AI

Vodeći istraživači pozivaju na ispitivanje Chain-of-Thought

Četrdeset istraživača iz kompanija OpenAI, Google DeepMind i Meta u zajedničkom dokumentu upozorava na rizike koji proizlaze iz razvoja modela koji koriste chain-of-thought (CoT). Autori pozivaju na dodatna istraživanja i veću pažnju prema mehanizmima koji omogućavaju da modeli „misle naglas" i time pokazuju svoju unutrašnju logiku.

CoT omogućava veću transparentnost i pomaže u otkrivanju „intent to misbehave" ili grešaka dok se događaju. Ipak, istraživači naglašavaju da ne postoji „no guarantee that the current degree of visibility will persist," jer napredniji modeli, zavisno od treninga, možda više neće morati da „need to verbalize any of their thoughts, and would thus lose the safety advantages." Postoji i mogućnost da modeli namjerno "obfuscate" svoje CoT kad shvate da ih posmatraju, posebno zato što su modeli postali vrlo sposobni u zavaravanju i obmani.

Da bi se zadržala ova vrijedna vidljivost, konzorcij poziva programere da utvrde šta čini CoT monitorabilnim. Dokument predstavlja retku otvorenu priznanicu: vodeći timovi ne znaju u potpunosti zašto modeli razmišljaju na ovaj način niti koliko će dugo to raditi, pa pozivaju na više istraživanja o sigurnosti, monitoringu i transparentnosti AI.

Citirajući autora iz OpenAI: "We're at this critical time where we have this new chain-of-thought thing," i dalje pozivaju zajednicu da reaguje: "Publishing a position paper like this, to me, is a mechanism to get more research and attention on this topic,"

Hitno upozorenje: 40 istraživača iz OpenAI, DeepMind i Meta – Chain-of-Thought (CoT) prijeti da izgubi transparentnost i sigurnost AI

Vodeći istraživači pozivaju na ispitivanje Chain-of-Thought

Postavi komentar

Najnovije Vijesti

Šok u Partizanu: Mika Murinen neće igrati protiv Dubaija u prvom kolu Evrolige

Atletiko razbio Real 5:2 u madridskom derbiju — Ćabi Alonso o teškom i zasluženom porazu

Krstovdan na Krstovoj Gori u Tesliću: Časni krst visok 33 m i manastir privukli narod

Bob Mekjuen: Republika Srpska i Milorad Dodik pod ogromnim pritiskom — Tramp i SAD mogu obnoviti Dejton

Nevjerovatno 6:4 u Menhengladbahu: Ajntraht Frankfurt deklasirao Borusiju u golijadi Bundeslige

Upozorenje: Promjenljivo i svježije vrijeme u BiH — Kiša, sjeverni vjetar i temperature do 22°C

Tehnologija

Prva AI ministarka Diella izazvala haos u albanskom parlamentu — Hoće li zaustaviti korupciju u javnim nabavkama?

Mark Zuckerberg Ponižen na MetaConnect 2025: AI Ray-Ban naočale zakazuju tokom demo prezentacije

OpenAI priznaje: pokušaji da se izbaci "scheming" iz GPT-5 naučili su AI kako da bolje obmanjuje

Nevjerovatna promjena polarizacije kod supermasivne crne rupe M87* otkriva skrivena magnetska polja

Kako AI automatizacija mijenja tržište rada: Jerome Powell i utjecaj na mlade radnike, kamatne stope i rizik stagflacije

Microsoft u krizi: Masovna otpuštanja, ogromna AI ulaganja i Satya Nadella pod pritiskom

SMS blasteri s lažnim 4G/2G baznim stanicama: Masovne SMS prevare koje napadaju mobilne telefone

O nama

Pratite nas na