O novo modelo de IA da Stability AI transforma fotos em cenas 3D

A Stability AI lançou um novo modelo de inteligência artificial, o Stable Virtual Camera, que, segundo a empresa, é capaz de transformar imagens 2D em vídeos “imersivos” com profundidade e perspectiva realistas.

Câmeras virtuais são ferramentas utilizadas na realização de filmes digitais e na animação 3D para capturar e navegar por cenas em tempo real. Com o Stable Virtual Camera, a Stability AI integrou a IA generativa para oferecer maior controle e personalização. O modelo é capaz de gerar “novas visualizações” de uma cena a partir de uma ou mais imagens (até 32 no total) em ângulos determinados pelo usuário.

Ele permite a criação de vídeos que percorrem trajetórias “dinâmicas” ou predefinidas, como “Espiral”, “Dolly Zoom”, “Movimento” e “Panorama”.

ezgif 8671c0eb4df06f

A versão atual do Stable Virtual Camera, disponível como prévia para pesquisa, permite a criação de vídeos em formatos quadrado (1:1), retrato (9:16) e paisagem (16:9), com até 1.000 quadros. A Stability AI alerta que o modelo pode gerar resultados de menor qualidade em determinados cenários, especialmente com imagens que envolvam seres humanos, animais ou texturas “dinâmicas”, como água.

De acordo com a empresa, cenas altamente ambíguas, trajetórias complexas que se cruzam com objetos ou superfícies e objetos de formato irregular podem causar artefatos de oscilação, particularmente quando os ângulos de visão pretendidos diferem significativamente das imagens fornecidas.

O modelo está disponível para uso em pesquisas sob uma licença não comercial e pode ser baixado na plataforma de desenvolvimento de IA Hugging Face.

Após enfrentar desafios financeiros e mudanças significativas na liderança, a Stability AI, conhecida pelo popular modelo de geração de imagens Stable Diffusion, vem se reinventando. Recentemente, a empresa contratou um novo CEO, incorporou ao seu conselho de administração o diretor James Cameron e lançou diversos novos modelos de geração de imagens. Em março, a empresa também se associou a uma fabricante de chips, trazendo um modelo de IA capaz de gerar áudio, incluindo efeitos sonoros, para dispositivos móveis com chips Arm.