OpenAI priznaje: novi modeli o3 i o4-mini češće izmišljaju informacije nego prethodni
PC Press pre 5 sati | Nemanja Momčilović

Novi AI modeli koje je OpenAI nedavno predstavio — o3 i o4-mini — predstavljaju vrhunac tehnologije kada su u pitanju rezonovanje i analitika, ali istovremeno donose i zabrinjavajući problem: veću stopu halucinacija, odnosno generisanja netačnih ili izmišljenih informacija.
Iako donose napredak u kodiranju i matematici, modeli imaju problem sa „halucinacijama“ Tradicionalno, svaki novi model imao je tendenciju da manje halucinira u odnosu na prethodni. Međutim, interni testovi OpenAI-a pokazuju da o3 i o4-mini haluciniraju češće nego stariji modeli poput o1, o1-mini, o3-mini, pa čak i GPT-4o, koji nije deo “rezonujuće” serije. Šta pokazuju podaci? Na internom benchmark testu PersonQA, koji meri tačnost znanja o ljudima, model: o3