AI generiše govor na drugom jeziku pomoću audio snimka od dve sekunde
Benchmark 19.06.2023 | Sara Smolović

Novi oblik generativne veštačke inteligencije (AI) Voicebox čiji je razvoj predstavila kompanija Meta može da proizvodi audio klipove tako što sintetiše govor pomoću audio snimka koji traje samo dve sekunde.
Na taj način Voicebox može da radi i multilingvalno, kada kao AI generiše govor na drugom jeziku dok obrađuje zadati uzorak. Naime, njemu se može zadati audio uzorak i odlomak nekog teksta na jednom od čak šest jezika u koje spadaju: engleski, španski, portugalski, francuski, nemački i poljski, koje on potom može da pretvori i pročita na bilo kom od tih jezika. Tako, Voicebox korisniku može da odgovara u audio formatu, generiše tekst u govor ili da ponovo kreira