Stability AI lance son modèle d’imagerie avancé, SDXL 0.9, qui génère des images nettement plus détaillées et mieux composées que la version précédente. L’entreprise souligne que cette amélioration est suffisamment importante pour offrir des applications pratiques pour les images générées par l’IA dans toute une série d’industries.
Avec la sortie de SDXL 0.9, Stability AI fait un « bond en avant » dans la génération d’images hyperréalistes pour diverses applications créatives et industrielles. Par rapport au modèle précédent, le nouveau modèle présente des détails et une composition d’image considérablement améliorés, selon l’entreprise.
Il est accessible via ClipDrop et l’API sera bientôt disponible. Les utilisateurs peuvent s’attendre à une version ouverte des poids de recherche à la mi-juillet, alors que le modèle approche de sa version 1.0.
SDXL 0.9 offre un large éventail d’utilisations créatives pour les images générées par l’IA, notamment des créations hyperréalistes pour le cinéma, la télévision, la musique, la vidéo éducative, la conception et les applications industrielles. Selon Stability AI, ces capacités placent son dernier modèle à l’avant-garde des applications du monde réel pour l’imagerie IA.
Des fonctionnalités au-delà de l’imagerie
En plus de l’invite de texte de base, SDXL 0.9 offre de nombreuses fonctionnalités, notamment l’invite d’image à image (insérer une image pour obtenir des variations), l’inpainting (reconstruction des parties manquantes d’une image) et l’outpainting (expansion parfaite d’images existantes).
Les améliorations apportées à la composition dans SDXL 0.9 se traduisent par une augmentation significative du nombre de paramètres par rapport à la version bêta précédente. Les paramètres représentent la somme de tous les poids et biais dans un réseau neuronal, et ce modèle a un modèle de base de 3,5 milliards de paramètres et un pipeline d’ensemble de modèles avec 6,6 milliards de paramètres. En revanche, la version bêta n’utilisait qu’un modèle de 3,1 milliards de paramètres.
Pour générer des images plus réalistes avec une plus grande profondeur et une résolution de 1024×1024, SDXL 0.9 utilise deux modèles CLIP, dont le plus grand modèle OpenCLIP à ce jour (OpenCLIP ViT-G/14).
Prix abordable et performances sur du matériel grand public
Malgré ses fonctionnalités avancées et son architecture de modèle, SDXL 0.9 peut fonctionner sur un GPU grand public moderne, ne nécessitant qu’un système d’exploitation Windows 10 ou 11 ou Linux, 16 Go de RAM et une carte vidéo Nvidia GeForce RTX 20 (ou équivalente) avec au moins 8 Go de VRAM. Les utilisateurs de Linux peuvent utiliser une carte AMD compatible avec 16 Go de VRAM.
Depuis le lancement de la version bêta le 13 avril, SDXL a généré plus de 700 000 images et a reçu des « réponses formidables » de « près de 7 000 » utilisateurs de la communauté Discord. La plateforme organise régulièrement des « affrontements », avec 54 000 images soumises et 3 521 images SDXL déclarées gagnantes.
Disponibilité et projets futurs
SDXL 0.9 est disponible sur la plateforme ClipDrop de Stability AI, avec un accès pour les utilisateurs de l’API et de DreamStudio à partir du 26 juin. Le code permettant d’exécuter la version open source sera disponible ultérieurement via GitHub. La version open source du modèle SDXL 1.0 complet est prévue pour la mi-juillet.
Actuellement, SDXL 0.9 est publié sous une licence non commerciale réservée à la recherche, et les chercheurs peuvent demander l’accès aux modèles.