Stability AIの最も先進的なテキスト画像変換モデル、Stable Diffusion XL (SDXL) 1.0がAPI、GitHub、Amazon Bedrock経由で利用可能になり、最先端のAI画像処理技術を開発者と顧客に提供します。
Stability AIは、最新かつ最先端のテキスト画像変換モデルであるStable Diffusion XL(SDXL) 1.0のリリースを発表した。このモデルは、Amazon Web Services(AWS)のフルマネージドサービスであるAmazon Bedrockで利用可能で、主要なAI企業やAmazon Titan自体の基本モデルへのAPIアクセスを提供する。
このモデルは、Stability AIのAPI、GitHubページ、コンシューマー向けアプリのClipdropとDreamStudioからアクセスできる。また、機械学習アルゴリズム、モデル、ソリューションへのアクセスを提供する機械学習ハブ、Amazon SageMaker JumpStartでも利用できる。
SDXL 1.0は、6月にリリースされた研究専用のSDXL 0.9を引き継ぐものです。同社によると、このモデルは、より鮮やかで正確な色、より優れたコントラスト、ライティング、シャドウを生成するために改良されたという。さらに、画像処理プロセスが最適化され、さまざまなアスペクト比のフル1メガピクセル解像度(1024×1024)の画像をより高速に出力できるようになった。
SDXLにDreambooth機能を統合
また、SDXL 1.0を微調整するための新しいベータ版微調整機能も導入され、ユーザーはわずか5枚の画像を使用して、特定の人物や製品に特化したジェネレーションを作成できます。
SDXL 1.0は、利用可能なオープンアクセス画像モデルの中で最も強力なモデルの1つであり、35億パラメータの基本モデルと66億パラメータのモデルセットパイプラインを備えています。Stability.aiのClipdropを使って、このモデルを無料で試すことができます。
品質という点では、SDXLはおそらくMidjourneyのレベルに迫る唯一の市販の画像モデルであり、オープンソースであるおかげで、さらに多くの機能とオプションが提供されている。
4月にSDXLのベータ版が公開されて以来、ClipDropのユーザーはこのテンプレートを使って3,500万枚以上の画像を生成しており、Stability AIのDiscordコミュニティでは1日平均2万枚の画像が生成されているという。
Stability AIはAWSと強固な関係を築いており、2022年にAWSを優先クラウドプロバイダーとして選択し、Amazon SageMaker上で基盤モデルを構築した。Stability AIのStable Diffusionモデルは、Amazon Bedrockが4月にローンチされた際、いち早く利用可能となった。The Decoderからの情報です。