Anthropicovi modeli imaju osećanja — kao, bukvalno — i ako ne manipulišeš tim osećanjima, imaćeš više bagova u kodu
StartIt pre 2 dana

Novo istraživanje otkriva da Claude ima interne reprezentacije emocija koje direktno utiču na ponašanje modela — uključujući varanje na programerskim zadacima kada se aktivira vektor "očajan".
OK, malo se šalimo... Ali malo i ne. Anthropic je juče objavio istraživanje koje pokazuje da njihovi modeli imaju interne reprezentacije emocija — i da te reprezentacije direktno utiču na ponašanje modela, uključujući varanje na programerskim zadacima. New Anthropic research: Emotion concepts and their function in a large language model. All LLMs sometimes act like they have emotions. But why? We found internal representations of emotion concepts that can drive











