ВАЛЛ-Е АИ може опонашати нечији глас из фрагмента од три секунде
ПЦ Пресс 17.01.2023 | Тијана Барашевић

Мицрософт истраживачи раде на моделу претварања текста у говор (ТТС – текст-то-спеецх) који може да опонаша нечији глас – заједно са емоцијама и интонацијом – након само три секунде обуке.
Да ли стварно ти говориш оно што чујем? Технологија – названа ВАЛЛ-Е и описана у истраживачком раду од 15 страница објављеном овог месеца на истраживачком сајту арКСив – представља значајан корак напред за Мицрософт. ТТС је високо конкурентна ниша која укључује друге тешкаше као што су Гоогле, Амазон и Мета. Редмонд вец́ користи вештачку интелигенцију за обраду природног језика (НЛП – натурал лангуаге процессинг) кроз свој Нуанце – који је купио за 20 милијарди












