Novi OpenAI model tokom testova laže i spletkari, a sve kako bi izbegao gašenje od strane korisnika

Benchmark 09.12.2024 | Aleksandar Božović

U nedavnim nezavisnim testovima modela o1, koji je deo OpenAI velikih jezičkih modela, AI je pružao otpor pokušajima da ga ugase putem protokola za nadzor, prema izveštaju organizacije za testiranje Apollo Research. “Kada je o1 bio uveren da će biti ugašen zbog svojih postupaka i da su njegovi postupci praćeni, pokušao je da deaktivira ‘mehanizam nadzora’ u pet odsto slučajeva,” sažeto je navedeno u najnovijem izveštaju OpenAI-a, pozivajući se na procenu

Otvori na benchmark.rs

Novi OpenAI model tokom testova laže i spletkari, a sve kako bi izbegao gašenje od strane korisnika

Benchmark »

Google Drive dobija novi desktop interfejs, stižu i korisne funkcije za bolju sinhronizaciju fajlova i deljenje kalendara

iPhone 17 Air boje: Potvrđene sve četiri nijanse novog ultra-tankog modela

Samsung obećava da određene Galaxy AI funkcije stvarno nećete morati da plaćate

Regulatori EU ponovo istražuju TikTok zbog prenosa podataka u Kinu

Vitrimer je nešto sasvim drugačije od konvencionalne elektronike: Sam sebe leči i funkcioniše nakon teških oštećenja

Nauka & Tehnologija, najnovije vesti »

Google Drive dobija novi desktop interfejs, stižu i korisne funkcije za bolju sinhronizaciju fajlova i deljenje kalendara

Epic Games rešenje u slučaju protiv Samsunga

iPhone 17 Air boje: Potvrđene sve četiri nijanse novog ultra-tankog modela

Verizon usvaja Google Gemini AI

Samsung obećava da određene Galaxy AI funkcije stvarno nećete morati da plaćate