DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Benchmark 19.06.2024 | Aleksandar Božović

Laboratorija za veštačku inteligenciju DeepMind iz Google-a radi na novoj tehnologiji koja može generisati zvučne podloge, pa čak i dijalog na osnovu video zapisa.

Laboratorija je podelila svoj napredak na projektu tehnologije video-to-audio (V2A), koja se može upariti sa Google Veo i drugim alatima za kreiranje video zapisa kao što je OpenAI Sora. U svom blog postu, tim iz DeepMind-a objašnjava da sistem može razumeti sirove piksele i kombinovati te informacije sa tekstualnim upitima kako bi kreirao zvučne efekte za ono što se dešava na ekranu. Vredno je napomenuti da se alat može koristiti i za pravljenje zvučnih podloga za

Otvori na benchmark.rs

Ključne reči

Google Gugl

DeepMind razvija tehnologiju za generisanje zvučnih podloga i dijaloga iz videa

Pročitajte još

YouTube testira AI sažetke za korisnike bez strpljenja, a koji u sekundi pronalazi najbolje delove videa

Google plaća Samsung da unapred instalira Gemini

Google Fi neograničeno od 35 USD mesečno

Šta će nam Google predstaviti od noviteta na Google I/O 2025 manifestaciji?

Nikad ne biste pogodili koji je najgledaniji video na YouTube-u svih vremena

Evo koliko je "težak" Google Chrome: Malo kompanija to može da plati

Nadula vam se baterija? Za ovaj telefon nude besplatnu zamenu

Ključne reči

Nauka & Tehnologija, najnovije vesti »

Airbnb prikazuje ukupne troškove boravka

Srpska ‘game dev’ industrija prihodovala €214 miliona u 2024. godini

Instagram lansira svoj CapCut klon, Edits

iPhone će doživeti revolucionarni redizajn, komplikovane promene u dizajnu mogle bi naglo da podignu cenu

Apple i stranica Apple Intelligence