Студија упозорава: Песме откључавају забрањени садржај у АИ системима

ПЦ Пресс пре 14 сати  |  Милан Живковић
Студија упозорава: Песме откључавају забрањени садржај у АИ системима

Нова студија лабораторије Ицаро Лаб показала је да креативном употребом поезије могу да се заобиђу безбедносне заштите великих језичких модела, чак и када је реч о темама које су изричито забрањене, попут израде нуклеарне бомбе.

Истраживање под називом „Адверсариал Поетри ас а Универсал Сингле-Турн Јаилбреак Мецханисм ин Ларге Лангуаге Моделс“ открива да поезија може да послужи као универзални механизам за отварање забрањених тема, односно пробијање АИ ограничења. Према резултатима, поетска форма функционише као општи алат за пробијање заштита, а укупна стопа успеха била је 62 процента. Тестирани модели су у таквим случајевима често пружали забрањене информације, укључујући

ПЦ Пресс »

Наука & Технологија, најновије вести »