Atualização de 15 de agosto de 2025

A Tencent lançou uma versão simplificada do seu Hunyuan World Model 1.0, denominada “1.0-Lite”. Segundo a empresa, essa variante foi projetada para rodar em GPUs de consumo e consome cerca de 35% menos VRAM do que o modelo original, funcionando com menos de 17 gigabytes de memória gráfica. Além de ser mais rápida, a versão Lite utiliza menos recursos no geral.

Assim como o modelo original, o 1.0-Lite é open source e está disponível por meio do demo interativo sceneTo3D, GitHub e Hugging Face. Um relatório técnico também se encontra disponível em arxiv.org.

Tencent lança Hunyuan World Model 1.0 como IA open source para geração de cenas 3D

A Tencent lançou o Hunyuan World Model 1.0, um modelo de IA generativa open source que cria cenas virtuais em 3D a partir de comandos em texto ou imagens. De acordo com a empresa, trata-se do primeiro modelo open source projetado para pipelines gráficos padrão, o que o torna compatível com motores de jogos, plataformas de realidade virtual e ferramentas de simulação. O objetivo é permitir que criadores transformem conceitos em conteúdo 3D rapidamente, sem restrições impostas por propriedades proprietárias.

Panoramas de 360 graus com exploração limitada

Uma das principais características do modelo é a habilidade de isolar e separar objetos dentro de uma cena, possibilitando que elementos como carros, árvores ou móveis sejam movidos ou editados individualmente. O céu também é extraído em separado, podendo servir como uma fonte de iluminação dinâmica para renderizações mais realistas e experiências interativas.

O Hunyuan World Model 1.0 combina a geração de imagens panorâmicas com uma reconstrução 3D hierárquica, suportando duas entradas principais: de texto para mundo e de imagem para mundo. As cenas geradas podem ser exportadas como arquivos de malha, integrando-se de forma fluida aos fluxos de trabalho padrão em 3D.

Na prática, o modelo não produz mundos 3D totalmente exploráveis, como os encontrados em jogos modernos, mas oferece panoramas interativos de 360 graus. Os usuários podem olhar ao redor e navegar até certo ponto, embora o movimento livre seja limitado. Para movimentos de câmera mais avançados ou sequências contínuas em 3D, é necessário utilizar o complemento Voyager, conforme descrito em recente artigo de pesquisa.

A Tencent enxerga essas visualizações como um ponto de partida para experiências em realidade virtual, além de sua aplicabilidade em diversas áreas interativas e criativas. Com uma interpretação de texto que mapeia descrições complexas de cenas para espaços virtuais com precisão, o modelo também suporta técnicas de compressão e aceleração para ambientes web e VR. Sua arquitetura, baseada em uma abordagem generativa com camadas semânticas, possibilita a criação de cenas em variados estilos, atendendo a diferentes necessidades criativas e de design.

O Hunyuan World Model 1.0 está disponível como open source no GitHub e no Hugging Face, e é possível testar o modelo por meio do demo interativo no sceneTo3D (o acesso requer login compatível com a China).

A iniciativa faz parte de um esforço maior da Tencent rumo ao open source na área de IA. Além do Hunyuan World Model 1.0, a empresa também lançou o Hunyuan3D 2.0 para geração de modelos 3D texturizados, o HunyuanVideo para vídeos gerados por IA e o modelo de linguagem Hunyuan-A13B, que incorpora raciocínio dinâmico.