Reed NewsReed News

Mistral AI lanserar Voxtral TTS – en lågkostnadsmodell för text-till-tal

Vetenskap & teknikVetenskap
Nyckelpunkter
  • Mistral AI lanserade Voxtral TTS, en öppen källkodsmodell för text-till-tal för röstassistenter och företagsanvändning.
  • Modellen stöder nio språk och kan skapa anpassade röster från mindre än fem sekunders ljud.
  • Den behåller röstkarakteristika över språk och har låg latens på 90 millisekunder, med lägre kostnad än konkurrenter.

Det franska AI-företaget Mistral AI har lanserat Voxtral TTS, en ny öppen källkodsmodell för text-till-tal som är utformad för röstassistenter och företagsapplikationer som kundsupport och försäljning. Modellen stöder nio språk inklusive engelska, franska, tyska och arabiska, och kan skapa en anpassad röst från mindre än fem sekunders ljud. Den behåller röstkarakteristika som accent och intonation vid byte mellan språk, vilket gör den lämplig för dubbning och realtidsöversättning.

Med en latens så låg som 90 millisekunder är Voxtral TTS enligt uppgift snabbare och kostar en bråkdel av andra marknadsmodeller.

Transparens

Så verifierade vi denna artikel

LågBaserat på 2 källor
2 källor2 Inblandade