Jedno dugme na tastaturi srušilo sve zidove mete: Kako je čuveno "space" napravilo pravi haos

Kurir 01.08.2024
Jedno dugme na tastaturi srušilo sve zidove mete: Kako je čuveno "space" napravilo pravi haos

Ispostavilo se da Prompt-Guard-86M može biti prevaren ako se dodaju razmaci između slova i izostavi interpunkcija.

Najnoviji model za detekciju napada pomoću promptova kompanije Meta, Prompt-Guard-86M, razvijen za prepoznavanje štetnih unosa i jailbreak ulaza, pokazao se ranjivim na iste napade koje je trebalo da spreči. Meta je prošle nedelje predstavila ovaj model zajedno sa svojim generativnim modelom Llama 3.1 kako bi pomogla programerima da otkriju i reaguju na ove pretnje. Veliki jezički modeli (LLM) obučeni su na ogromnim količinama teksta i podataka, što može dovesti do

Pročitajte još

Ključne reči

Nauka & Tehnologija, najnovije vesti »