Stable Animation: Stability AI ha añadido capacidades de animación a sus modelos de imágenes con Stable Diffusion. La herramienta de vídeo actualmente solo está disponible a través de una API de pago.

Stability AI anunció un kit de desarrollo para Stable Animation, una nueva forma de crear imágenes en movimiento. El modelo acepta tres tipos diferentes de entrada:

  • Con una indicación de texto, similar a Stable Diffusion, Midjourney o DALL-E 2.
  • Con una indicación de texto y una imagen como punto de partida para la animación.
  • Con una indicación de texto y un vídeo.

Parece que el software aún está en una fase experimental. En lugar de ofrecerlo a través de uno de sus navegadores, como DreamStudio o ClipDrop, Stability AI solo proporciona un kit de desarrollo de software (SDK) y una API de pago. Sin embargo, esto no impide que terceros ofrezcan el modelo de animación a través de su servicio.

Se requiere scripting en Python

Dado que los vídeos deben generarse mediante un script en Python, su manejo es bastante complicado. Al igual que con el modelo de imágenes, se pueden configurar numerosos parámetros, como pasos, muestreo, escala o semilla. Además, se ofrecen características como la expansión de imágenes o la interpolación de indicaciones.

Diferentes parámetros también afectan el precio, por lo que no hay una respuesta general a la pregunta de cuánto cuesta crear un vídeo. Las tarifas de estabilidad varían de 3 a 18 centavos de dólar estadounidense por cada 100 cuadros en diferentes configuraciones.

La Stable Animation es compatible con la Stable Diffusion XL

La Stable Animation se puede combinar con cualquier versión de la Stable Diffusion. La versión estándar es la 1.5, pero también puedes optar por utilizar la nueva y mejorada Stable Diffusion XL. También se ofrecen muchos preajustes de estilo, desde anime hasta cómics, low poly hasta pixel art.

La resolución es de 512 x 512 píxeles sin ajuste y se puede aumentar a 1024 x 1024 píxeles. Además, se puede utilizar un escalador. El estándar es de 72 cuadros a 12 cuadros por segundo, pero según la documentación, se puede aumentar hasta el infinito.

Ya existen herramientas de animación basadas en Stable Diffusion que pueden, por ejemplo, generar una secuencia corta de imágenes en movimiento mediante interpolación de indicaciones, es decir, cambiando continuamente ciertas propiedades de la entrada. Pero, a juzgar por la demostración de Stability AI, la Stable Animation promete ser una solución mucho más completa y madura.

Aunque todavía no es posible producir películas en movimiento con un solo clic, proyectos como la Stable Animation, junto con los avances de Runway ML o modelos como Phenaki e Imagen Video, muestran hacia dónde se dirige la Inteligencia Artificial Generativa Visual en el futuro cercano, pasando de imágenes estáticas a animaciones similares a GIFs.