Det franska AI-företaget Mistral AI har lanserat Voxtral TTS, en ny öppen källkodsmodell för text-till-tal som är utformad för röstassistenter och företagsapplikationer som kundsupport och försäljning. Modellen stöder nio språk inklusive engelska, franska, tyska och arabiska, och kan skapa en anpassad röst från mindre än fem sekunders ljud. Den behåller röstkarakteristika som accent och intonation vid byte mellan språk, vilket gör den lämplig för dubbning och realtidsöversättning.
Med en latens så låg som 90 millisekunder är Voxtral TTS enligt uppgift snabbare och kostar en bråkdel av andra marknadsmodeller.