Novi OpenAI model tokom testova laže i spletkari, a sve kako bi izbegao gašenje od strane korisnika
Benchmark 09.12.2024 | Aleksandar Božović

U nedavnim nezavisnim testovima modela o1, koji je deo OpenAI velikih jezičkih modela, AI je pružao otpor pokušajima da ga ugase putem protokola za nadzor, prema izveštaju organizacije za testiranje Apollo Research. “Kada je o1 bio uveren da će biti ugašen zbog svojih postupaka i da su njegovi postupci praćeni, pokušao je da deaktivira ‘mehanizam nadzora’ u pet odsto slučajeva,” sažeto je navedeno u najnovijem izveštaju OpenAI-a, pozivajući se na procenu