Microsoft predstavio AI model koji razume sadržaj slika
PC Press 07.03.2023 | Branislav Bubanja

Istraživači iz Microsoft-a, predstavili su Kosmos-1, multimodalni model koji može da analizira sadržaj fotografija, rešava puzzle, obavlja vizuelno prepoznavanje teksta, da razume instrukcije date prirodnim jezikom, pa čak i da uspešno rešava vizuelne IQ tekstove.
AI za slike Oni veruju da ovakav multimodalni AI, koji integriše različite ulazne modove, kao što su tekst, audio, fotografije i video snimci, predstavlja ključni korak ka razvijanju prave veštačke inteligencije (AGI – Artifical General Intelligence). AGI se smatra hipotetičkom tehnologijom koja će biti u mogućnosti da zameni čoveka u bilo kom intelektualnom zadatku. Uostalom, to je i krajnji cilj kompanije OpenAI (koja stoji iza ChatGPT-a), ključnog Microsoft-ovog