A startup norte-americana Suno é especializada na geração de áudio de IA a partir de texto. Seu mais recente modelo de áudio gera algumas músicas impressionantes.
No início de setembro, a Suno revelou seu mais recente modelo de texto para música, Chirp v1, que pode gerar música, incluindo vocais, com base no estilo e nas letras. A maior melhoria é que a v1 pode converter gêneros como rock, pop, K-pop e descrições como melódico ou rápido em música.
As letras agora podem ser divididas em partes usando comandos como [verso] e [refrão] para dar mais estrutura às músicas geradas. As letras podem ser digitadas ou geradas diretamente na interface do Chirp usando o ChatGPT.
A startup observa que prompts com uma referência de artista específica não são suportados, provavelmente para evitar discussões sobre direitos autorais. Foi o que aconteceu quando uma música gerada por IA com as vozes de Drake e The Weeknd viralizou. A canção foi posteriormente bloqueada pela Universal Music Group.
Geração de músicas de IA no Discord
A geração Chirp é totalmente integrada ao Discord, semelhante ao Midjourney. Para cada prompt Chirp, o modelo gera duas variações, geralmente entre 20 e 40 segundos de duração. Se você gosta de uma variação, você pode gerar mais clicando em “Continuar”, que pode adicionar até 30 segundos a uma geração enquanto continua o estilo da geração anterior.
Se você quiser se inspirar ou conhecer o potencial do Chirp, basta navegar pelos servidores do Discord – mais de 40.000 usuários garantem que haja uma oferta constante de músicas. Você está fadado a encontrar uma joia ou duas, como esta canção de amor politicamente motivada. Ouviremos mais sobre isso em breve?
Ou você pode pegar letras existentes de músicas conhecidas e deixar a IA gerá-las em um novo estilo musical.
A complexidade das canções combinada com a qualidade das vozes geradas às vezes é impressionante. Ainda não há toppers de gráficos, mas no ritmo atual de desenvolvimento de IA generativa, isso pode mudar rapidamente. Suno postou algumas demonstrações particularmente boas do novo modelo em um site.
A Suno suporta mais de 50 idiomas, com o inglês e o rock tendo o melhor desempenho nos meus testes. O estilo também parece ser influenciado pelo conteúdo ou estrutura das letras. Com base nas letras, uma imagem de fundo correspondente é gerada para cada clipe de áudio.
Chirps grátis no Discord
A Suno oferece 250 créditos gratuitos por mês no Discord, o que equivale a 25 chirps. Chirps podem ser gerados no servidor público ou nas DMs do Discord. Um plano Pro oferece 1000 créditos / até 100 chirps por mês e custa US $ 10 por mês. Você pode comprar gerações adicionais. Mais informações sobre os modelos de pagamento podem ser encontradas aqui.
Na primavera passada, a Suno apresentou o Bark, um modelo de texto para fala e áudio que está disponível gratuitamente no Github sob a licença do MIT para uso comercial. O Bark também está disponível via Discord.