F Lite é um modelo de imagem de IA aberto desenvolvido para segurança de direitos autorais
Freepik apresenta “F Lite”, um novo modelo de transformação de texto em imagem treinado exclusivamente com material seguro de direitos autorais, posicionando-se como uma alternativa legalmente segura a geradores controversos.
O modelo mais recente de IA generativa da empresa, F Lite, conta com cerca de 10 bilhões de parâmetros e foi treinado unicamente com imagens licenciadas comercialmente da própria coleção da Freepik. Segundo a empresa, isso torna o F Lite o primeiro modelo disponível publicamente, em larga escala, a depender inteiramente de conteúdo “apto para todos os públicos”.
Desenvolvido em parceria com a startup de IA Fal.ai, o treinamento ocorreu ao longo de dois meses, utilizando 64 GPUs Nvidia H100 e um conjunto de dados interno composto por aproximadamente 80 milhões de imagens.
Com o F Lite, a Freepik se junta a um grupo crescente de geradores de imagens construídos com dados verificados legalmente, como os oferecidos por Adobe, Getty Images e Shutterstock. A demanda por conjuntos de dados seguros quanto a direitos autorais ganha força em meio a processos judiciais movidos contra empresas que usam imagens coletadas na internet.
Diferente de alguns concorrentes, a Freepik posiciona o F Lite como uma alternativa aberta em que desenvolvedores podem construir suas aplicações. O modelo está disponível no GitHub, embora sua execução exija uma GPU com pelo menos 24 GB de VRAM. Há também uma demonstração disponível para experimentação.
O feedback humano aprimora a qualidade das imagens
A Freepik afirma que o F Lite se destaca na geração de ilustrações e composições no estilo vetor, provavelmente devido aos dados de treinamento provenientes do próprio catálogo da empresa.
No entanto, quando se trata de imagens fotorrealistas, o modelo apresenta dificuldades: detalhes como a textura da pele ou de tecidos costumam estar ausentes, e cenas com composições anatômicas complexas podem exibir erros visíveis. O modelo também tem dificuldade em lidar com comandos curtos, uma vez que foi treinado principalmente com textos mais longos e descritivos. Renderizar textos com precisão dentro das imagens continua sendo um desafio.
A interpretação do comando “fotografia DSLR, um cara de barba vermelha dançando na chuva” pelo F Lite apresenta uma estética retrô, remetendo aos primórdios da IA.
O mesmo comando, quando processado por outro famoso gerador de imagens, resulta em uma representação artística e fotorrealista que dificilmente passa como obra de IA.
A empresa atribui essas limitações ao tamanho do conjunto de dados utilizado e à quantidade de recursos computacionais disponíveis. Segundo a Freepik, as conhecidas leis de escalonamento para modelos de difusão indicam que a qualidade e os detalhes melhoram significativamente com mais dados e períodos mais extensos de treinamento.
Com sede na Espanha, a Freepik se especializa em gráficos digitais licenciados para designers, empresas e profissionais criativos. A plataforma oferece uma ampla variedade de mídias, desde gráficos vetoriais, fotos e ilustrações até ícones e modelos para apresentações. Além das assinaturas pagas, uma parte do conteúdo também é disponibilizada gratuitamente.
Nos últimos anos, a Freepik ampliou seus investimentos em ferramentas baseadas em IA, oferecendo recursos para edição automática de imagens, criação de conteúdo e, agora, geração sintética de imagens.