Flux 2 klein traz geração e edição de imagens por IA para placas gráficas de consumo

A startup alemã de inteligência artificial Black Forest Labs lança o Flux 2 klein, um modelo compacto que combina geração e edição de imagens em GPUs de uso geral, como a RTX 3090.

Os novos modelos expandem a família Flux 2, apresentada em novembro, com duas variantes principais: uma versão emblemática de 9 bilhões de parâmetros e uma versão mais enxuta de 4 bilhões, voltada para um uso mais amplo. Ambas estão disponíveis em variantes base não destiladas para pesquisa e ajustes finos.

Geração e edição locais em GPUs de consumo

O Flux 2 klein reúne três funcionalidades em um único modelo: a geração de imagens a partir de texto, a edição de imagens e a geração com múltiplas referências, que permite combinar diversas imagens de entrada em novas composições.

Embora essa combinação não seja inédita – a Black Forest Labs já havia estabelecido as bases com o modelo de contexto Flux 1 há menos de um ano – a principal inovação do Flux 2 klein é que essa arquitetura unificada agora está encaixada em um pacote compacto, capaz de rodar em hardware de consumo. O modelo de 4 bilhões de parâmetros necessita de apenas 13 gigabytes de VRAM, funcionando em placas gráficas como a Nvidia RTX 3090 ou RTX 4070.

Comparação antes e depois da edição de imagens por IA: troca de objetos, adição de elementos e combinações de estilo.

O Flux 2 klein é capaz de substituir fundos, trocar objetos ou combinar elementos de várias imagens.

Geração rápida com ressalvas

O modelo de 9 bilhões utiliza uma arquitetura de fluxo otimizada para gerar imagens em apenas quatro etapas de computação. A Black Forest Labs promete tempos de geração inferiores a 0,5 segundos, embora esse parâmetro tenha sido medido utilizando o chip profissional GB200 da Nvidia, e não GPUs convencionais.

A empresa também colaborou com a Nvidia para desenvolver versões quantizadas do modelo. A quantização reduz a precisão dos pesos, diminuindo os requisitos de memória e o tempo de processamento.

A variante FP8 (formato de ponto flutuante de 8 bits) opera até 1,6 vezes mais rápido, utilizando até 40% menos VRAM, de acordo com a Black Forest Labs. Já a variante NVFP4, que utiliza o formato proprietário de ponto flutuante de 4 bits da Nvidia, permite um aumento de velocidade de até 2,7 vezes com uma redução de até 55% no consumo de memória. Esses parâmetros foram medidos nas modernas GPUs RTX 5080 e RTX 5090.

Colagem de estilos de arte por IA, como anime, stop-motion, fantasia e visualizações arquitetônicas.

O modelo é versátil, abrangendo desde animações 3D até ilustrações clássicas.

Em suas próprias comparações de desempenho, a Black Forest Labs posiciona o modelo de 9 bilhões como Pareto-ótimo em termos de qualidade versus latência. A empresa afirma que ele iguala ou supera a qualidade do Qwen com uma fração da latência e do consumo de VRAM, supera o Z-Image e renderiza melhor que modelos cinco vezes maiores. Esses parâmetros ainda não foram verificados de forma independente.

A licença varia conforme o tamanho do modelo: o de 4 bilhões utiliza a licença open Apache 2.0, permitindo uso comercial sem restrições, enquanto o de 9 bilhões é destinado apenas para uso não comercial, exigindo uma licença separada para empresas. A Black Forest Labs disponibiliza uma implementação de referência no GitHub, e o modelo também é compatível com o ComfyUI e com a biblioteca Diffusers do Python.

Filtros de segurança e marca d’água

A Black Forest Labs descreve suas medidas de segurança na documentação do Hugging Face. Os dados de treinamento foram previamente filtrados para conteúdo NSFW e material conhecido de abuso sexual infantil, contando inclusive com a colaboração da British Internet Watch Foundation.

Após o treinamento, o modelo passou por várias rodadas de ajustes finos direcionados para mitigar potenciais cenários de abuso. O repositório inclui filtros que atuam tanto nas entradas quanto nas saídas para conteúdo NSFW, além de oferecer suporte para marca d’água em nível de pixel e para o padrão C2PA de verificação de procedência.

Vale ressaltar que o modelo possui limitações conhecidas: não é adequado para transmitir informações factuais, a saída de texto pode apresentar imprecisões e a aderência ao prompt depende fortemente do estilo de solicitação.

Uma avaliação de US$ 3,25 bilhões respalda o lançamento

O Flux 2 klein surge em um período de rápido crescimento para a empresa alemã. Em dezembro de 2025, a Black Forest Labs concluiu uma rodada Série B de US$ 300 milhões, elevando sua avaliação para US$ 3,25 bilhões. Fundada em 2024, a startup já arrecadou um total de US$ 450 milhões.

Anteriormente, os modelos Flux estavam disponíveis por meio do chatbot Grok da xAI, embora a xAI de Elon Musk tenha desenvolvido seu próprio modelo de imagem fotorrealista – que inclusive se demonstrou surpreendentemente eficaz em desnudar pessoas, inclusive menores.

Em vez de desenvolver aplicativos para usuários finais, a Black Forest Labs está se posicionando como fornecedora de infraestrutura para outras empresas e já anunciou que também está trabalhando em um gerador de vídeos competitivo.