AlphaEvolve é o novo sistema de IA da Google DeepMind que cria algoritmos melhores de forma autônoma
O Google DeepMind revelou o AlphaEvolve, um sistema que utiliza grandes modelos de linguagem para automatizar a descoberta e o aprimoramento de algoritmos. O objetivo é desenvolver novos algoritmos, aperfeiçoá-los sistematicamente e adaptá-los para usos práticos.
O AlphaEvolve funciona combinando duas versões dos modelos de linguagem Gemini do Google. O Gemini Flash é responsável por gerar uma ampla gama de candidatos a programas, enquanto o Gemini Pro analisa essas propostas em profundidade.
Em seguida, um algoritmo evolutivo entra em ação para avaliar os resultados com base em métricas objetivas como precisão e eficiência computacional. As variantes com melhor desempenho são selecionadas e aprimoradas continuamente em um ciclo iterativo.
A DeepMind descreve o AlphaEvolve como um “agente de computação em tempo de teste” — um sistema de IA que explora ativamente e avalia novas soluções enquanto está em execução. Assim como os modelos de raciocínio atuais, o AlphaEvolve utiliza computação em tempo de teste para melhorar seus resultados através da resolução ativa de problemas.
No entanto, enquanto os modelos de raciocínio “padrão” geralmente aplicam um processo em tempo de teste para gerar respostas passo a passo para um único comando, o AlphaEvolve vai além ao executar um ciclo evolutivo: ele gera, testa e refina algoritmos inteiros por várias iterações. Essa abordagem se baseia nos princípios do raciocínio em tempo de teste, mas os expande para a tarefa mais ampla da descoberta e otimização automatizada de algoritmos.

O fluxo de trabalho do AlphaEvolve envolve a entrada inicial de um programa e sua configuração feita por um cientista ou engenheiro. A partir daí, o sistema inicia um ciclo evolutivo, onde amostradores de prompt, conjuntos de modelos de linguagem e avaliadores colaboram para gerar e refinar programas de forma iterativa, armazenando os melhores resultados em um banco de dados. A DeepMind afirma que os avanços alcançados pelo AlphaEvolve podem ser condensados e incorporados aos modelos de linguagem subjacentes, transformando o que o sistema aprende em versões mais eficientes desses modelos.
Ganho de eficiência na infraestrutura do Google
A DeepMind afirma que o AlphaEvolve já está sendo utilizado em diversas partes da infraestrutura do Google. Em um exemplo, o sistema desenvolveu uma nova heurística para a alocação de recursos no sistema de gerenciamento “Borg”, liberando 0,7% a mais de capacidade computacional. A nova solução é robusta e de fácil compreensão para os seres humanos.
Além disso, o AlphaEvolve contribuiu para a otimização do próprio modelo Gemini. Ao aprimorar a forma como as multiplicações de matrizes são distribuídas, o sistema reduziu os tempos de treinamento em 1%. Em outro caso, a otimização do kernel FlashAttention — um componente crítico das GPUs para a execução de grandes modelos de linguagem — resultou em uma melhoria de até 32,5% nos testes de benchmark.
Essas otimizações são particularmente desafiadoras, pois estão profundamente integradas na pilha de software e raramente são revistas por engenheiros humanos. Com o AlphaEvolve, processos que antes exigiam semanas de trabalho manual podem agora ser concluídos em apenas alguns dias de experimentação automatizada. Segundo o Google DeepMind, isso permite uma adaptação mais rápida a novos hardwares e reduz os custos de desenvolvimento de sistemas de IA a longo prazo.
Avanços na matemática
O Google DeepMind também testou o AlphaEvolve em mais de 50 problemas matemáticos abertos. O sistema conseguiu reconstruir soluções conhecidas em cerca de 75% dos casos e encontrou respostas melhores do que as previamente conhecidas em 20% dos desafios.
Um exemplo marcante é o problema do número de beijos (kissing number), que investiga quantas esferas de mesmo tamanho podem tocar uma esfera central sem se sobreporem. No caso de onze dimensões, o AlphaEvolve descobriu uma nova configuração com 593 esferas, estabelecendo um novo limite inferior.
No campo da matemática algorítmica, o AlphaEvolve desenvolveu uma nova forma de multiplicar matrizes 4×4 complexas utilizando apenas 48 multiplicações escalares — uma melhoria em relação ao método clássico de Strassen, de 1969. Enquanto o seu predecessor se concentrou exclusivamente na multiplicação de matrizes, o AlphaEvolve foi projetado para enfrentar uma gama muito mais ampla de desafios algorítmicos.
Esses resultados indicam que o AlphaEvolve não apenas replica soluções existentes, mas também é capaz de descobrir novas abordagens em áreas especializadas da ciência da computação e da matemática.
Onde o AlphaEvolve se encaixa — e onde ainda não se aplica
O AlphaEvolve é mais adequado para problemas que podem ser expressos algoritmicamente e avaliados automaticamente. A DeepMind vislumbra aplicações em áreas como pesquisa de materiais, desenvolvimento de medicamentos e otimização de processos industriais. A empresa também está investindo em uma interface amigável para o usuário e em um programa de acesso antecipado para instituições acadêmicas.
No entanto, existem limites. Para problemas que não podem ser avaliados de forma confiável por testes automatizados — como aqueles que dependem de experimentos no mundo real — o AlphaEvolve apresenta menor eficácia. A DeepMind sugere que, no futuro, modelos de linguagem poderão fornecer avaliações qualitativas iniciais antes de uma análise mais estruturada, e já investiga abordagens híbridas nesse sentido.
Enquanto o AlphaEvolve se baseia em parte no FunSearch, sistema anterior lançado pela DeepMind em 2023, ele vai muito além. Se o FunSearch era capaz de encontrar soluções para desafios matemáticos como cap sets e bin packing, o AlphaEvolve foi desenvolvido para criar algoritmos completos e práticos para uma variedade consideravelmente maior de problemas.