A Stability AI adicionou uma nova ferramenta à sua plataforma de IA ClipDrop: o Stable Doodle. Essa ferramenta permite que você converta um simples rabisco em imagens de IA de alta resolução.

Além do rabisco, que pode ser desenhado facilmente com o mouse, é possível inserir uma descrição do que o seu rabisco deve representar. Opcionalmente, você pode escolher um dos 14 estilos disponíveis. Esses estilos variam desde o fotorealismo e a fotografia analógica até origami, anime e arte em pixel.

SDXL encontra o adaptador T2I da Tencent

O Stable Doodle é baseado no modelo mais recente e poderoso da Stability AI, o Stable Diffusion XL, mas em uma versão não especificada. Portanto, não está claro se esta é a versão 0.9 do SDXL, que atualmente só está disponível através do ClipDrop e DreamStudio.

Para converter esboços a mão em imagens detalhadas, a Stability combina o SDXL com o adaptador T2I (texto para imagem) de código aberto da Tencent ARC.

O T2I pode ser adicionado a um modelo de difusão grande existente, como o Stable Diffusion XL, fornecendo condições de entrada adicionais, como esboços, mapas de segmentação ou até mesmo poses. É semelhante ao ControlNet, que já é amplamente utilizado no Stable Diffusion.

O T2I ou o ControlNet possuem a vantagem de não afetar a capacidade original de geração do modelo pré-treinado e podem ser facilmente aplicados a diferentes modelos, desde que sejam baseados nos mesmos fundamentos (ou seja, não apenas o SDXL, mas também o SD v1.5, etc.).

Experimente gratuitamente através do Clipdrop

Você pode experimentar o Stable Doodle gratuitamente no site e nos aplicativos para Android e iOS do Clipdrop. No entanto, o download de imagens sem marca d'água está disponível apenas para membros Pro.

Basicamente, a ferramenta é direcionada tanto para amadores quanto para profissionais e, segundo a Stability, tem o potencial de melhorar significativamente diversas indústrias, desde educação até design criativo.

Transformar rabiscos em imagens de IA tem uma tradição

O Stable Doodle se junta a um grupo crescente de formas de influenciar o resultado de uma imagem de IA com entrada adicional além de prompts de texto. Recentemente, por exemplo, a Adobe demonstrou como personalizar melhor imagens de IA por meio do posicionamento de objetos 3D.

Essa é a aparência das imagens de IA baseadas em desenhos em 2018. Imagem: affinelayer.com

A ideia de incorporar desenhos simples no processo de geração de imagens não é nova. Em 2018, a DeepMind experimentou com uma abordagem semelhante, embora os resultados não se comparem à resolução e ao nível de detalhes oferecidos pelo Stable Doodle.