aiOla lansira ultra-brzi ‘multi-head’ model za prepoznavanje govora, nadmašuje OpenAI Whisper
PC Press 03.09.2024 | Tijana Barašević
Izraelski AI startup aiOla predstavio je novi open-source model za prepoznavanje govora, Whisper-Medusa, koji je 50% brži od poznatog OpenAI Whispera. 50% povećanje brzine predviđanja govora bez smanjenja tačnosti Whisper-Medusa koristi inovativnu arhitekturu “multi-head attention” koja omogućava predviđanje više tokena istovremeno, značajno povećavajući brzinu prepoznavanja govora. Kod i težine modela su dostupni na Hugging Face pod MIT licencom. Prema Gillu