DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa
Benchmark 19.06.2024 | Aleksandar Božović
Laboratorija za veštačku inteligenciju DeepMind iz Google-a radi na novoj tehnologiji koja može generisati zvučne podloge, pa čak i dijalog na osnovu video zapisa.
Laboratorija je podelila svoj napredak na projektu tehnologije video-to-audio (V2A), koja se može upariti sa Google Veo i drugim alatima za kreiranje video zapisa kao što je OpenAI Sora. U svom blog postu, tim iz DeepMind-a objašnjava da sistem može razumeti sirove piksele i kombinovati te informacije sa tekstualnim upitima kako bi kreirao zvučne efekte za ono što se dešava na ekranu. Vredno je napomenuti da se alat može koristiti i za pravljenje zvučnih podloga za