Los modelos de imagen de IA pueden generar nuevas imágenes o modificar las existentes. DreamGenerator muestra cómo puede funcionar esto en una cámara.
A diferencia de las cámaras convencionales, DreamGenerator te permite elegir el mundo en el que se tomará la siguiente foto: el cielo o el infierno, la Edad Media, bajo el agua o el espacio exterior, hay muchas variaciones. Hay treinta temas preprogramados.

Una vez capturada una foto, se transforma instantáneamente en una nueva imagen utilizando el tema preseleccionado. Se conservan las características fundamentales de la foto, como la postura y los rasgos faciales de una persona, o la perspectiva desde la que se fotografía un coche en un aparcamiento. El único cambio es que, tras capturar la foto, el coche representado se convierte en un nuevo Ferrari en lugar de un viejo Honda.

«Las imágenes generadas hacen referencia a la composición y la pose de la foto original, garantizando que se mantienen los elementos clave a la vez que se añaden nuevos toques imaginativos», escribe el desarrollador Kyle Goodrich.
Introducing DreamGenerator! 📸✨
— Kyle Goodrich (@_kylegoodrich) July 18, 2023
A camera that transforms your photos into something new using the power of generative AI.
Choose from 30 prompts, capture, and watch as your image morphs into a one-of-a-kind masterpiece right before your eyes! 🧵 pic.twitter.com/NJMxQ09Rna
Por supuesto, esto no tiene nada que ver con la fotografía auténtica. Pero Goodrich dice que lo que más le interesa es simplificar el complejo proceso de sugerencia de sistemas como Stable Diffusion. Esto podría hacerse con una aplicación de smartphone, por supuesto, pero Goodrich dice que prefiere la sencillez de una cámara de apuntar y disparar.
ControlNet permite ajustar Stable Diffusion con un mínimo de datos
Para las imágenes, Goodrich utiliza una combinación de Stable Diffusion de código abierto y ControlNet, un sencillo método de ajuste fino que mejora significativamente las capacidades de imagen a imagen de Stable Diffusion.
En este caso, el ajuste fino para un tema determinado se realiza con pequeños conjuntos de datos, como una sola fotografía. Al igual que Stable Diffusion, ControlNet es un software gratuito de código abierto que puede ejecutarse incluso en teléfonos inteligentes.
En el siguiente vídeo, Goodrich, diseñador de productos de realidad aumentada en Snapchat, muestra un prototipo de hardware y software. No menciona ninguna versión comercial, así que los que quieran la cámara de IA probablemente tendrán que construirla ellos mismos (o crearla como una aplicación para su smartphone).
This is currently a prototype that leverages Stable Diffusion and ControlNet.
— Kyle Goodrich (@_kylegoodrich) July 18, 2023
The generated images reference the composition and pose of the original photo, ensuring that key elements are retained while also adding in new imaginative touches. pic.twitter.com/DKdT6POXTc