
O CEO da Google Deepmind, Demis Hassabis, afirma que os modelos de mundo — sistemas de IA que simulam a estrutura do mundo real — já estão fazendo avanços surpreendentes rumo à inteligência geral.
Hassabis destacou o modelo de vídeo mais recente, Veo 3, como um exemplo desses sistemas que conseguem captar a dinâmica da realidade física. “É impressionante o quão bem o Veo 3 modela a física intuitiva”, afirmou, interpretando esse desempenho como um sinal de que esses modelos estão alcançando uma compreensão mais profunda do que a mera geração de imagens.
Para ele, tais modelos de IA, também conhecidos como modelos de mundo, oferecem insights sobre a “complexidade computacional do mundo”, possibilitando uma compreensão mais profunda da realidade. Assim como o cérebro humano, eles não apenas constroem representações da realidade, mas capturam “parte da estrutura real do mundo físico lá fora”. Esse entendimento se alinha à sua “busca final”: compreender a natureza fundamental da realidade.
Modelos de mundo como uma ideia fundadora e estratégia da Deepmind
Construir modelos de mundo sempre foi central para a estratégia da Deepmind em direção à inteligência artificial geral, conforme afirma Hassabis. “Construir modelos de mundo sempre foi o plano do Google Deepmind para chegar à AGI”, declarou, retomando uma ideia que o acompanha desde a adolescência. Aos 17 anos, já projetava sistemas de IA para jogos de simulação, como o Theme Park, buscando modelar ambientes virtuais com o máximo de realismo.
Essa fascinação precoce se consolidou na visão fundadora da Deepmind: não se trata apenas de criar IAs que imitam a linguagem, mas de desenvolver sistemas capazes de compreender e atuar no mundo real. Um exemplo adicional dessa experimentação é o projeto Genie, que transforma imagens individuais em ambientes de jogos 3D interativos.
Da imitação à experiência
Essa ênfase nos modelos de mundo também é o foco de um recente artigo dos pesquisadores da Deepmind, Richard Sutton e David Silver. No trabalho, eles argumentam que a IA precisa evoluir, deixando de depender exclusivamente dos dados fornecidos por humanos para adotar sistemas que aprendem interagindo com seus ambientes.
Em vez de programar a intuição humana diretamente nos algoritmos, os pesquisadores propõem agentes que aprendem por meio de tentativa e erro — tal como animais ou pessoas. A chave está em dotar esses agentes de modelos internos do mundo: simulações que possibilitam a previsão de resultados, não só na linguagem, mas também por meio de experiências sensoriais e motoras. Nesse contexto, o aprendizado por reforço em ambientes realistas desempenha um papel fundamental.
Sutton, Silver e Hassabis veem essa mudança como o início de uma nova era na IA, em que a experiência passa a ser o alicerce. Segundo eles, os modelos de mundo são a tecnologia que viabilizará essa transformação.
Resumo
- Demis Hassabis, CEO da Google Deepmind, enxerga os recentes modelos de vídeo, como o Veo 3, como um grande avanço, pois eles capturam não só imagens, mas também as leis que regem o mundo físico.
- Ele destaca que a construção de modelos de mundo sempre foi a estratégia da Deepmind para alcançar a inteligência artificial geral (AGI), um objetivo que persegue desde sua juventude.
- Os pesquisadores Richard Sutton e David Silver propõem que os sistemas de IA devem aprender por meio da própria experiência em ambientes simulados, em vez de apenas imitar dados humanos, colocando os modelos de mundo no centro dessa transformação.