Plataforma de IA de voz Phonic recebe aporte da Lux
A qualidade das vozes geradas por inteligência artificial já é suficientemente boa para aplicações como a criação de audiolivros e podcasts, a leitura em voz alta de artigos e o suporte ao cliente básico. No entanto, muitas empresas ainda não consideram a tecnologia de voz por IA confiável o bastante para ser utilizada em larga escala.
Dois graduados do MIT, Moin Nadeem e Nikhil Murthy, fundaram a Phonic, uma empresa que oferece uma solução completa de voz com o objetivo de aumentar a confiabilidade das vozes sintéticas e diminuir a latência.
Nadeem e Murthy se conhecem há mais de sete anos, tendo se encontrado no MIT. Ao iniciarem o desenvolvimento da Phonic no ano passado, perceberam que havia poucas empresas no mercado capazes de criar soluções integrais para a tecnologia de voz.
Segundo Murthy, “a IA de voz chegou a um ponto onde é necessário integrar diferentes componentes, como reconhecimento automático de voz e conversão de texto em fala, além de incorporar inteligência. Contudo, ao conversarmos com clientes, constatamos a falta de soluções confiáveis em escala.”
Nadeem, que anteriormente integrou a MosaicML — adquirida pela Databricks em 2023 — comentou que muitas empresas que atuam no setor de IA para voz estão criando fluxos de trabalho para conectar diferentes modelos de IA.
A abordagem da Phonic, entretanto, é distinta: a empresa treina seus modelos internamente de ponta a ponta. Murthy apontou algumas vantagens dessa estratégia. “Ao possuirmos os próprios modelos, conseguimos integrar de forma profunda elementos de confiabilidade diretamente neles. Se você não controla essa camada, acaba apenas juntando componentes díspares que não se conectam de maneira fluida”, explicou.
Ele ainda destacou que esse método permite à Phonic hospedar e operar seus modelos de forma mais econômica. Os modelos são treinados com uma ampla gama de gravações — incluindo aquelas com sotaques variados e vozes abafadas —, o que os torna extremamente robustos.
No momento, a Phonic trabalha com um grupo restrito de parceiros, entre eles empresas dos setores de seguros e saúde, mas a expectativa é lançar o produto para o mercado de forma ampla nos próximos meses. Em breve, potenciais clientes poderão testar a tecnologia diretamente pelo site da empresa.
A empresa levantou US$ 4 milhões em uma rodada seed liderada pela Lux, com a participação de investidores notáveis como o cofundador da Replit, Amjad Masad; o cofundador da Hugging Face, Clem Delangue; o cofundador da Applied Intuition, Qasar Younis; e o fundador da Modal Labs, Erik Bernhardsson.