StyleDrop aprende o estilo de qualquer imagem e ajuda um modelo de IA generativa a recriá-lo. O método do Google supera outros como Dreambooth, LoRA ou Inversão Textual.

O novo método do Google permite a síntese de imagens em um estilo específico usando o modelo de texto-imagem Muse. O StyleDrop captura as complexidades de um estilo personalizado, incluindo esquemas de cores, sombreamento, padrões de design e efeitos locais e globais. De acordo com o Google, tudo o que é necessário como entrada é uma única imagem.

O StyleDrop aprende o novo estilo ajustando um pequeno número de parâmetros de rede treináveis e melhora a qualidade do modelo por meio de treinamento iterativo com feedback humano ou automático.

O StyleDrop aprende rápido e com poucos exemplos

Especificamente, o StyleDrop é treinado na imagem de entrada e gera um conjunto de imagens para reproduzir aquela imagem. A partir dessas imagens, as de mais alta qualidade são selecionadas, seja por meio de uma pontuação CLIP ou por feedback humano, e são usadas para treinamento adicional. Uma imagem é considerada de alta qualidade se ela não reproduzir o conteúdo, mas sim o estilo da imagem original.

Todo o processo leva menos de três minutos, mesmo com feedback humano, afirmou a equipe. Isso ocorre porque o StyleDrop precisa de menos de uma dúzia de imagens para o treinamento iterativo, segundo eles.

O StyleDrop supera outros métodos de transferência de estilo de modelos de texto para imagem, incluindo Dreambooth, LoRAs e Inversão Textual em Imagen e Diffusion Estável, de acordo com a equipe.

StyleDrop com Muse em comparação com outros métodos e modelos. | Imagem: Google
StyleDrop com Muse em comparação com outros métodos e modelos. | Imagem: Google

StyleDrop para estilo, Dreambooth para objetos

“Observamos que o StyleDrop é capaz de capturar nuances de textura, sombreamento e estrutura em uma ampla variedade de estilos, significativamente melhor do que abordagens anteriores, permitindo um controle muito maior sobre o estilo do que anteriormente possível”, disse a equipe.

A equipe também combina o StyleDrop com o Dreambooth para aprender e criar um novo objeto em diferentes estilos como uma imagem, e pode usar os métodos com o Muse para criar um objeto personalizado em um estilo personalizado.

StyleDrop aprende um estilo e Dreambooth aprende um novo objeto, como um cachorro. | Imagem: Google
StyleDrop aprende um estilo e Dreambooth aprende um novo objeto, como um cachorro. | Imagem: Google

O Google considera o StyleDrop uma ferramenta versátil, sendo um dos casos de uso permitir que designers ou empresas treinem com seus ativos de marca e prototipem rapidamente novas ideias em seu estilo. Mais informações estão disponíveis na página do projeto StyleDrop.