Koliko informacije veliki jezički modeli zaista pamte?

PC Press pre 3 sata  |  Tijana Barašević
Koliko informacije veliki jezički modeli zaista pamte?

Veliki jezički modeli (LLM – Large Language Models), kao što su ChatGPT, Claude (Anthropic) i Gemini (Google), poznati su po tome da su trenirani na ogromnim skupovima podataka.

Zahvaljujući istraživačima iz kompanija Meta, Google, Nvidia i sa Univerziteta Kornel — sada znamo U pitanju su trilioni reči sa veb-sajtova, knjiga, kodova, a sve češće i iz drugih medija kao što su slike, zvuk i video. Ali ključno pitanje koje se postavlja jeste: da li ti modeli zaista razumeju jezik — ili samo pamte ono što su „videli”? Kako modeli funkcionišu? LLM-ovi analiziraju velike količine teksta i uče statističke obrasce jezika — kako su reči povezane,

Pročitajte još

Ključne reči

Nauka & Tehnologija, najnovije vesti »