El modelo de conversión de texto en imagen más avanzado de Stability AI, Stable Diffusion XL (SDXL) 1.0, ya está disponible a través de API, GitHub y Amazon Bedrock, lo que pone la tecnología de imagen de IA más avanzada al alcance de desarrolladores y clientes.
Stability AI ha anunciado el lanzamiento de Stable Diffusion XL (SDXL) 1.0, el último y más avanzado modelo de conversión de texto en imagen de su suite. El modelo está disponible en Amazon Bedrock, un servicio totalmente gestionado de Amazon Web Services (AWS) que proporciona acceso API a modelos fundamentales de empresas líderes en IA y del propio Amazon Titan.
Se puede acceder al modelo a través de la API de Stability AI, la página de GitHub y sus aplicaciones para consumidores Clipdrop y DreamStudio. También está disponible en Amazon SageMaker JumpStart, un centro de aprendizaje automático que ofrece acceso a algoritmos, modelos y soluciones de aprendizaje automático.
SDXL 1.0 sucede al lanzamiento en junio de SDXL 0.9, destinado exclusivamente a la investigación. Según la empresa, el modelo se ha perfeccionado para producir colores más vivos y precisos y mejorar el contraste, la iluminación y las sombras. Además, el proceso de creación de imágenes se ha optimizado para ofrecer un resultado más rápido con imágenes de resolución completa de 1 megapíxel (1024×1024) en varias relaciones de aspecto.
La SDXL incorpora la función Dreambooth
También se ha introducido una nueva función de ajuste beta, que utiliza un pequeño conjunto de imágenes para ajustar SDXL 1.0, lo que permite a los usuarios especializar la generación para personas o productos concretos utilizando sólo cinco imágenes.
SDXL 1.0 es uno de los modelos de imágenes de libre acceso más potentes que existen, con un modelo base de 3.500 millones de parámetros y un conjunto de modelos de 6.600 millones de parámetros. Puede probar el modelo gratuitamente utilizando Clipdrop de Stability.ai.
En términos de calidad, SDXL es probablemente el único modelo de imagen disponible comercialmente que se acerca al nivel de calidad de Midjourney y, gracias a su naturaleza de código abierto, ofrece aún más funciones y opciones, aunque es un poco más difícil de usar si quieres sacarle el máximo partido.
Desde el lanzamiento de la beta de SDXL en abril, los usuarios de ClipDrop han generado más de 35 millones de imágenes utilizando la plantilla, y la comunidad Discord de Stability AI ha generado una media de 20.000 imágenes al día, según la empresa.
Stability AI tiene una sólida relación con AWS, ya que lo seleccionó como su proveedor de nube preferido en 2022 y construyó sus modelos fundacionales en Amazon SageMaker. El modelo Stable Diffusion de Stability AI fue uno de los primeros en estar disponible en Amazon Bedrock cuando se lanzó en abril. Con información de The Decoder.