Le modèle texte-image le plus avancé de Stability AI, Stable Diffusion XL (SDXL) 1.0, est désormais disponible via API, GitHub et Amazon Bedrock, mettant ainsi la technologie d’imagerie IA de pointe à la disposition des développeurs et des clients.
Stability AI a annoncé la sortie de Stable Diffusion XL (SDXL) 1.0, le modèle texte-image le plus récent et le plus avancé de sa suite. Le modèle est disponible sur Amazon Bedrock, un service entièrement géré par Amazon Web Services (AWS) qui fournit un accès API aux modèles fondamentaux des principales sociétés d’IA et à Amazon Titan lui-même.
Le modèle est accessible via l’API de Stability AI, sa page GitHub et ses applications grand public Clipdrop et DreamStudio. Il est également disponible sur Amazon SageMaker JumpStart, un hub d’apprentissage automatique qui offre un accès aux algorithmes, modèles et solutions d’apprentissage automatique.
SDXL 1.0 succède à SDXL 0.9, publié en juin dernier et réservé à la recherche. Selon l’entreprise, le modèle a été affiné pour produire des couleurs plus vives et plus précises, un meilleur contraste, un meilleur éclairage et de meilleures ombres. En outre, le processus d’imagerie a été optimisé pour produire plus rapidement des images d’une résolution totale de 1 mégapixel (1024×1024) dans différents rapports d’aspect.
SDXL intègre la fonction Dreambooth
Une nouvelle fonction de réglage fin bêta est également introduite, qui utilise un petit ensemble d’images pour affiner SDXL 1.0, ce qui permet aux utilisateurs de spécialiser la génération pour des personnes ou des produits spécifiques en utilisant seulement cinq images.
SDXL 1.0 est l’un des modèles d’images les plus puissants disponibles en libre accès, avec un modèle de base de 3,5 milliards de paramètres et un pipeline de jeux de modèles de 6,6 milliards de paramètres. Vous pouvez essayer le modèle gratuitement en utilisant Clipdrop de Stability.ai.
En termes de qualité, SDXL est probablement le seul modèle d’image disponible dans le commerce qui se rapproche du niveau de qualité de Midjourney, et grâce à sa nature open-source, il offre encore plus de fonctionnalités et d’options – bien qu’il soit un peu plus difficile à utiliser si vous voulez en tirer le meilleur parti.
Depuis le lancement de la version bêta de SDXL en avril, les utilisateurs de ClipDrop ont généré plus de 35 millions d’images à l’aide du modèle, et la communauté Discord de Stability AI a généré en moyenne 20 000 images par jour, selon l’entreprise.
Stability AI entretient des relations étroites avec AWS, qu’elle a choisi comme fournisseur de cloud privilégié en 2022, et a construit ses modèles de base sur Amazon SageMaker. Le modèle Stable Diffusion de Stability AI a été l’un des premiers à être mis à disposition sur Amazon Bedrock lors de son lancement en avril. Avec des informations provenant de The Decoder.