A Elevenlabs se especializa na geração de vozes sintéticas de alta qualidade. Agora, a startup apresenta seu modelo mais recente.

O novo modelo “Eleven Multilingual v2” suporta 28 idiomas, que ele reconhece automaticamente e converte de texto para fala. De acordo com a Elevenlabs, ele alcança uma autenticidade de voz ainda melhor do que seu antecessor.

As características da voz de um locutor, seja ela gerada sinteticamente ou um clone de voz, são preservadas em todos os idiomas, permitindo que uma única voz seja usada para todos os idiomas.

A primeira versão da Elevenlabs já apresentava algumas das gerações de voz de maior qualidade do mercado. Uma demonstração da nova versão pode ser ouvida no vídeo abaixo.

A Elevenlabs agora oferece suporte aos idiomas chinês, coreano, holandês, turco, sueco, indonésio, filipino, japonês, ucraniano, grego, tcheco, finlandês, romeno, dinamarquês, búlgaro, malaio, eslovaco, croata, árabe padrão e tâmil. O inglês, polonês, alemão, espanhol, francês, italiano, hindi e português foram e continuam sendo suportados.

A Elevenlabs planeja lançar uma plataforma de compartilhamento de voz de IA

Com o lançamento da versão 2, a Elevenlabs encerra sua fase beta. De acordo com a empresa, sua tecnologia agora tem mais de um milhão de usuários em todo o mundo. No futuro, uma nova funcionalidade permitirá que os usuários compartilhem vozes na plataforma. A visão ambiciosa é tornar todo o conteúdo disponível em qualquer idioma e com qualquer voz.

O público-alvo são empresas de mídia, desenvolvedores de jogos, editoras e autores. Clientes que já utilizam a tecnologia incluem D-ID, Storytel, ScienceCast, TheSoul Publishing, Embark Studios, Paradox Interactive e MNTN. De acordo com a Elevenlabs, a tecnologia de áudio proprietária da empresa foi desenvolvida inteiramente internamente.