Stable Diffusion é um poderoso modelo de IA generativa para imagens, mas operá-lo por meio de interfaces web e locais frequentemente envolve muita ajustagem e engenharia de prompts. Fooocus tem como objetivo mudar isso.

Lvmin Zhang, a pessoa por trás do Fooocus, descreve o projeto como uma reformulação do design do Stable Diffusion e do Midjourney. Do Stable Diffusion, o Fooocus herda o modelo e o foco nas capacidades offline e no código aberto, do Midjourney, o foco na facilidade de uso: ajustes manuais de valores como CFG não são necessários, os usuários podem simplesmente se concentrar na imagem e no prompt.

Em resumo, o Fooocus é como uma versão gratuita offline do Midjourney usando o mais recente modelo SDXL da Stability AI. Embora o Midjourney geralmente ainda forneça melhores resultados em meus testes rápidos, o Fooocus com o SDXL chega perto.

O Fooocus tem requisitos baixos e é fácil de instalar

O Fooocus vem com uma instalação simples, e o número de cliques do mouse entre clicar em “baixar” e gerar a primeira imagem é mantido no mínimo, promete Zhang.

Nos bastidores, o projeto incorporou e automatizou muitas otimizações e melhorias de qualidade que normalmente teriam que ser configuradas manualmente para o Stable Diffusion em outras interfaces. Assim como no Midjourney, isso deve proporcionar bons resultados em cada tentativa. Se você quiser fazer mais, pode usar a guia Avançado no Fooocus. Aqui você pode configurar um filtro de nitidez ou LoRAs personalizados, por exemplo. Você também pode definir o estilo fazendo uma seleção simples.

Ele requer pelo menos uma placa de vídeo Nvidia com 4 gigabytes de RAM e 8 gigabytes de RAM do sistema sob o Windows. O Virtual Swap da Microsoft precisa estar habilitado, mas isso geralmente é feito automaticamente e pode ser ativado relativamente facilmente. Em um laptop com 16 gigabytes de RAM do sistema e uma Nvidia 3060 com 6 gigabytes de RAM, Zhang relata que a geração de imagens leva menos de 1,5 segundos.

Mais informações e o download estão disponíveis no GitHub do Fooocus.