O modelo de texto para imagem mais avançado da Stability AI, o Stable Diffusion XL (SDXL) 1.0, está agora disponível por meio de API, GitHub e Amazon Bedrock, trazendo tecnologia de imagem de IA de ponta para desenvolvedores e clientes.
A Stability AI anunciou o lançamento do Stable Diffusion XL (SDXL) 1.0, o mais recente e avançado modelo de texto para imagem em sua suíte. O modelo está disponível no Amazon Bedrock, um serviço totalmente gerenciado da Amazon Web Services (AWS) que fornece acesso à API a modelos fundamentais de empresas líderes de IA e da própria Amazon Titan.
O modelo pode ser acessado por meio da API da Stability AI, página do GitHub e suas aplicações para consumidores Clipdrop e DreamStudio. Também está disponível no Amazon SageMaker JumpStart, um hub de aprendizado de máquina que oferece acesso a algoritmos, modelos e soluções de aprendizado de máquina.
O SDXL 1.0 sucede o lançamento apenas para fins de pesquisa do SDXL 0.9 em junho. O modelo foi refinado para produzir cores mais vibrantes e precisas, melhor contraste, iluminação e sombras, segundo a empresa. Além disso, o processo de imagens foi otimizado para oferecer uma saída mais rápida com imagens de resolução total de 1 megapixel (1024×1024) em várias proporções.
SDXL vem com o recurso integrado Dreambooth
Uma nova funcionalidade de ajuste fino em versão beta também está sendo introduzida, que utiliza um pequeno conjunto de imagens para ajustar finamente o SDXL 1.0, permitindo que os usuários especializem a geração para pessoas ou produtos específicos usando apenas cinco imagens.
O SDXL 1.0 é um dos modelos de imagem de acesso aberto mais poderosos disponíveis, com um modelo base de 3,5 bilhões de parâmetros e um pipeline de conjunto de modelos de 6,6 bilhões de parâmetros. Você pode experimentar o modelo gratuitamente usando o Clipdrop da Stability.ai.
Em termos de qualidade, o SDXL é provavelmente o único modelo de imagem comercialmente disponível que chega perto do nível de qualidade do Midjourney, e graças à sua natureza de código aberto, ele oferece ainda mais recursos e opções – embora seja um pouco mais difícil de usar se você quiser aproveitar ao máximo.
Desde o lançamento do beta do SDXL em abril, os usuários do ClipDrop geraram mais de 35 milhões de imagens usando o modelo, e a comunidade Discord da Stability AI gerou em média 20.000 imagens por dia, de acordo com a empresa.
A Stability AI tem uma forte relação com a AWS, tendo a selecionado como seu provedor de nuvem preferido em 2022 e construído seus modelos fundamentais no Amazon SageMaker. O modelo Stable Diffusion da Stability AI foi um dos primeiros a ser disponibilizado no Amazon Bedrock quando foi lançado em abril. Com informações do The Decoder.