Jedno dugme na tastaturi srušilo sve zidove mete: Kako je čuveno "space" napravilo pravi haos
Kurir 01.08.2024

Ispostavilo se da Prompt-Guard-86M može biti prevaren ako se dodaju razmaci između slova i izostavi interpunkcija.
Najnoviji model za detekciju napada pomoću promptova kompanije Meta, Prompt-Guard-86M, razvijen za prepoznavanje štetnih unosa i jailbreak ulaza, pokazao se ranjivim na iste napade koje je trebalo da spreči. Meta je prošle nedelje predstavila ovaj model zajedno sa svojim generativnim modelom Llama 3.1 kako bi pomogla programerima da otkriju i reaguju na ove pretnje. Veliki jezički modeli (LLM) obučeni su na ogromnim količinama teksta i podataka, što može dovesti do