Seedance Bytedance title

ByteDance, a empresa por trás do TikTok, apresentou o Seedance 1.0, um novo modelo de geração de vídeos com IA.

De acordo com a ByteDance, o Seedance 1.0 supera os modelos existentes em diversas áreas, incluindo o seguimento preciso dos comandos do usuário, a qualidade dos movimentos e a nitidez das imagens. Na plataforma de benchmarking Artificial Analysis, o Seedance 1.0 lidera as tarefas de conversão de texto para vídeo e de imagem para vídeo, superando concorrentes como o Veo 3 do Google, o Kling 2.0 da Kuaishou e o Sora da OpenAI.

O modelo foi projetado para transformar comandos simples em vídeos complexos. Ele é capaz de renderizar não apenas cenas isoladas, mas também sequências extensas, com múltiplos ângulos de câmera e personagens mantidos de forma consistente durante o vídeo. Segundo a ByteDance, o Seedance 1.0 tende a manter os detalhes solicitados — sejam movimentos específicos, mudanças de câmera ou estilos visuais — de forma mais eficaz do que outros modelos.

Dados em Larga Escala e Filtragem Extensiva

Conforme informado pela ByteDance, o Seedance 1.0 foi treinado com uma imensa coleção de clipes de vídeo obtidos a partir de fontes públicas e licenciadas. Esses clipes passaram por várias etapas de limpeza para remover elementos como logotipos, legendas ou conteúdos violentos. Tanto anotações automáticas quanto manuais acrescentaram descrições detalhadas relativas a movimentos, aparência e estilo, oferecendo ao modelo uma base sólida para o entendimento de instruções complexas.

O processo de treinamento ocorreu em diversas fases. Inicialmente, o modelo aprendeu com um amplo conjunto de dados de imagens e vídeos, para posteriormente ser adaptado especificamente para tarefas de conversão de imagem para vídeo. Em seguimento, passou por uma fase de ajuste fino com clipes criteriosamente selecionados e por treinamento com feedback humano, no qual foram escolhidas as melhores respostas — como vídeos com movimentos mais naturais ou cenas que correspondiam com maior precisão às instruções. Esse ciclo de feedback foi fundamental para moldar o desenvolvimento do modelo.

Seedance 1.0 e Velocidade

Um dos destaques do Seedance 1.0 é a sua velocidade aliada à alta qualidade dos vídeos gerados. Segundo a ByteDance, a criação de cinco segundos de vídeo em Full HD leva cerca de 41 segundos, o que é significativamente mais rápido do que outros modelos similares. Contudo, com o lançamento do Veo 3 Fast pelo Google, essa vantagem pode ter sido minimizada. É importante ressaltar que o Seedance 1.0, no momento, não suporta a geração de áudio.

A ByteDance planeja integrar o Seedance 1.0 em suas plataformas internas, como Doubao e Jimeng. O modelo é direcionado tanto para profissionais quanto para o público em geral, abrangendo desde soluções para marketing e produção de conteúdo até edições de vídeo simples com comandos de voz.

Resumo

  • A ByteDance lançou o Seedance 1.0, um novo modelo de IA para geração de vídeos, que supera sistemas já estabelecidos como o Veo do Google, o Kling da Kuaishou e o Sora da OpenAI nas conversões de texto e imagem em vídeo.
  • Treinado com uma vasta coleção de clipes de vídeo limpos e altamente anotados, o modelo passou por múltiplas fases de desenvolvimento, incluindo ajustes baseados em feedback humano para aprimorar movimentos, ângulos e estilos visuais.
  • Capaz de criar vídeos complexos com várias cenas e mudanças de câmera de forma rápida, o Seedance 1.0 ainda não suporta geração de áudio. A ByteDance pretende utilizá-lo em plataformas como Doubao e Jimeng, atendendo tanto a profissionais quanto ao público em geral.