Anthropic: "Naša veštačka inteligencija je postala 'zla' zbog naučne fantastike"
B92 pre 7 sati

Fiktivni prikazi veštačke inteligencije mogu imati stvaran uticaj na AI modele, navodi kompanija Anthropic.
Prošle godine, Anthropic je saopštio da je tokom testova pre puštanja u rad, koji su uključivali fiktivnu kompaniju, Claude Opus 4 često pokušavao da uceni inženjere kako bi izbegao da bude zamenjen drugim sistemom. Anthropic je kasnije objavio istraživanje koje sugeriše da su modeli drugih kompanija imali slične probleme sa "agentnim neusklađivanjem" (engl. agentic misalignment). Izgleda da je Anthropic dodatno istražio ovakvo ponašanje, tvrdeći u objavi na mreži










