Elevenlabs se especializa en la generación de voces sintéticas de alta calidad. Ahora, la startup presenta su modelo más reciente.

El nuevo modelo «Eleven Multilingual v2» admite 28 idiomas, que reconoce automáticamente y convierte de texto a voz. Según Elevenlabs, logra una autenticidad de voz aún mejor que su predecesor.

Las características de la voz de un locutor, ya sea generada sintéticamente o un clon de voz, se conservan en todos los idiomas, lo que permite usar una única voz para todos los idiomas.

La primera versión de Elevenlabs ya presentaba algunas de las generaciones de voz de mayor calidad en el mercado. Se puede escuchar una demostración de la nueva versión en el video a continuación.

Elevenlabs ahora ofrece soporte para los idiomas chino, coreano, neerlandés, turco, sueco, indonesio, filipino, japonés, ucraniano, griego, checo, finlandés, rumano, danés, búlgaro, malayo, eslovaco, croata, árabe estándar y tamil. El inglés, polaco, alemán, español, francés, italiano, hindi y portugués han sido y continúan siendo compatibles.

Elevenlabs planea lanzar una plataforma de intercambio de voces de IA

Con el lanzamiento de la versión 2, Elevenlabs finaliza su fase beta. Según la empresa, su tecnología ahora cuenta con más de un millón de usuarios en todo el mundo. En el futuro, una nueva funcionalidad permitirá a los usuarios compartir voces en la plataforma. O

El público objetivo son las empresas de medios, los desarrolladores de juegos, las editoras y los autores. Los clientes que ya utilizan la tecnología incluyen a D-ID, Storytel, ScienceCast, TheSoul Publishing, Embark Studios, Paradox Interactive y MNTN. Según Elevenlabs, la tecnología de audio propietaria de la empresa se desarrolló completamente internamente.