DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Benchmark 19.06.2024 | Aleksandar Božović

Laboratorija za veštačku inteligenciju DeepMind iz Google-a radi na novoj tehnologiji koja može generisati zvučne podloge, pa čak i dijalog na osnovu video zapisa.

Laboratorija je podelila svoj napredak na projektu tehnologije video-to-audio (V2A), koja se može upariti sa Google Veo i drugim alatima za kreiranje video zapisa kao što je OpenAI Sora. U svom blog postu, tim iz DeepMind-a objašnjava da sistem može razumeti sirove piksele i kombinovati te informacije sa tekstualnim upitima kako bi kreirao zvučne efekte za ono što se dešava na ekranu. Vredno je napomenuti da se alat može koristiti i za pravljenje zvučnih podloga za

Otvori na benchmark.rs

DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Pročitajte još

„Neka me ubede u suprotno“ bivši šef Gugla "o poslovima koji će nestati“: Ai osvaja naše živote, biće brojnih promena

Ponovite se sa novom verzijom časovnika za Android, Google Clock 7.13 stiže putem Play prodavnice

ChatGPT koristi „memoriju“ za veb pretragu

Wikipedia nudi AI developerima strukturirani dataset kako bi rasteretila svoje servere

Google mora da proda Chrome: Pogodite ko želi da ga kupi!

Opasno: ChatGPT zna gde živite - treba mu samo slika

Google i Samsung kriju veliku tajnu: Evo šta se zapravo dešava sa vašim telefonima!

Ključne reči

Nauka & Tehnologija, najnovije vesti »

I oni su im zabranili video-igre i konzole

Intel naručio TSMC N2 procesore, najverovatnije za Nova Lake generaciju

Ovaj Android malver može vas potpuno osiromašiti! Saznajte kako da se zaštitite!

Kina priznala: Pozajmiće Americi jednu stvar uprkos tenzijama

Gotovo 45% kompanija prepoznaje sajber bezbednost kao ključni izazov u digitalizaciji OT okruženja