Parceria para Geração de Áudio em Dispositivos Móveis
A startup de IA Stability AI uniu forças com a fabricante de chips Arm para levar o Stable Audio Open a dispositivos móveis que utilizam chips Arm. Esse modelo de inteligência artificial é capaz de gerar áudio, inclusive efeitos sonoros, a partir de descrições textuais.
Desempenho e Otimização
Embora diversos aplicativos que utilizam IA, como Suno e Udio, possam gerar áudio, a maioria depende do processamento na nuvem, o que impede seu uso offline. Além disso, alguns modelos foram treinados com conteúdo protegido por direitos autorais, apresentando riscos de propriedade intelectual. A Stability garante que o conjunto de treinamento do Stable Audio Open é composto integralmente por áudios e músicas livres de royalties.
Na demonstração do modelo rodando em chips Arm, prevista para a Mobile World Congress em Barcelona, o Stable Audio Open é capaz de criar um som a partir de uma descrição textual, como “suaves ondas do oceano ao pôr do sol”. Segundo a empresa, a otimização e o processo de “destilação” realizados em parceria com a Arm aceleraram os tempos de geração em até 30 vezes, fazendo com que a criação de um áudio de 11 segundos leve aproximadamente 8 segundos em uma CPU Armv9.
Planos Futuros
Apesar do modelo otimizado do Stable Audio Open ainda não estar disponível para download, o CEO da Stability, Prem Akkaraju, afirmou que a empresa planeja levar seus modelos, incluindo o Stable Audio Open, para aplicativos e dispositivos de consumo no futuro. “À medida que mais profissionais criativos e empresas adotam a IA generativa para impulsionar seus processos de produção, é importante que nossos modelos e fluxos de trabalho estejam disponíveis em qualquer lugar para que desenvolvedores criem e artistas produzam”, ressaltou Akkaraju, destacando a empolgação com a parceria com a Arm.
A empresa também informou que continuará colaborando com a Arm para otimizar ainda mais e ajustar o Stable Audio Open para o ambiente móvel.
Contexto e Transformações na Empresa
A Stability, conhecida por trás do popular modelo de geração de imagens Stable Diffusion, obteve um novo fôlego financeiro no ano passado, com investidores como Eric Schmidt e Sean Parker, fundador do Napster, buscando reestruturar o negócio. A trajetória recente da empresa inclui desafios financeiros e mudanças na liderança, após o ex-CEO e cofundador Emad Mostaque ter levado a empresa a uma situação crítica, provocando a saída de funcionários, o desmantelamento de uma parceria com a Canva e preocupações entre os investidores.
Nos últimos meses, a Stability contratou um novo CEO, integrou James Cameron ao seu conselho de diretores e lançou diversos novos modelos de geração de imagens, evidenciando um esforço para renovar e expandir seu portfólio de soluções em inteligência artificial.