Los modelos de imagen de IA pueden generar nuevas imágenes o modificar las existentes. DreamGenerator muestra cómo puede funcionar esto en una cámara.

A diferencia de las cámaras convencionales, DreamGenerator te permite elegir el mundo en el que se tomará la siguiente foto: el cielo o el infierno, la Edad Media, bajo el agua o el espacio exterior, hay muchas variaciones. Hay treinta temas preprogramados.

DreamGenerator é a camera que já processa a imagem com o stable diffusion

Una vez capturada una foto, se transforma instantáneamente en una nueva imagen utilizando el tema preseleccionado. Se conservan las características fundamentales de la foto, como la postura y los rasgos faciales de una persona, o la perspectiva desde la que se fotografía un coche en un aparcamiento. El único cambio es que, tras capturar la foto, el coche representado se convierte en un nuevo Ferrari en lugar de un viejo Honda.

O DreamGenerator transforma um velho Honda em uma nova Ferrari. O nome do dispositivo parece bem escolhido.
El DreamGenerator convierte un viejo Honda en un nuevo Ferrari. El nombre del dispositivo parece bien elegido. | Imagen: Kyle Goodrich

«Las imágenes generadas hacen referencia a la composición y la pose de la foto original, garantizando que se mantienen los elementos clave a la vez que se añaden nuevos toques imaginativos», escribe el desarrollador Kyle Goodrich.

Por supuesto, esto no tiene nada que ver con la fotografía auténtica. Pero Goodrich dice que lo que más le interesa es simplificar el complejo proceso de sugerencia de sistemas como Stable Diffusion. Esto podría hacerse con una aplicación de smartphone, por supuesto, pero Goodrich dice que prefiere la sencillez de una cámara de apuntar y disparar.

ControlNet permite ajustar Stable Diffusion con un mínimo de datos

Para las imágenes, Goodrich utiliza una combinación de Stable Diffusion de código abierto y ControlNet, un sencillo método de ajuste fino que mejora significativamente las capacidades de imagen a imagen de Stable Diffusion.

En este caso, el ajuste fino para un tema determinado se realiza con pequeños conjuntos de datos, como una sola fotografía. Al igual que Stable Diffusion, ControlNet es un software gratuito de código abierto que puede ejecutarse incluso en teléfonos inteligentes.

En el siguiente vídeo, Goodrich, diseñador de productos de realidad aumentada en Snapchat, muestra un prototipo de hardware y software. No menciona ninguna versión comercial, así que los que quieran la cámara de IA probablemente tendrán que construirla ellos mismos (o crearla como una aplicación para su smartphone).