DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Benchmark pre 7 dana  |  Aleksandar Božović
DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Laboratorija za veštačku inteligenciju DeepMind iz Google-a radi na novoj tehnologiji koja može generisati zvučne podloge, pa čak i dijalog na osnovu video zapisa.

Laboratorija je podelila svoj napredak na projektu tehnologije video-to-audio (V2A), koja se može upariti sa Google Veo i drugim alatima za kreiranje video zapisa kao što je OpenAI Sora. U svom blog postu, tim iz DeepMind-a objašnjava da sistem može razumeti sirove piksele i kombinovati te informacije sa tekstualnim upitima kako bi kreirao zvučne efekte za ono što se dešava na ekranu. Vredno je napomenuti da se alat može koristiti i za pravljenje zvučnih podloga za

Pročitajte još

Ključne reči

Nauka & Tehnologija, najnovije vesti »