Mais inteligente, supostamente

O Gemini 2.5 Pro já chegou com números maiores e ótimas vibrações. O novo modelo de “pensamento” do Google está pronto para pensar por você.

Apenas alguns meses após o lançamento dos primeiros modelos de IA Gemini 2.0, o Google faz uma nova atualização. Segundo a empresa, o novo Gemini 2.5 Pro Experimental é o seu modelo “mais inteligente” até agora, oferecendo uma enorme janela de contexto, multimodalidade e capacidades de raciocínio. Diversos benchmarks demonstram que o novo Gemini supera outros grandes modelos de linguagem, e nossos testes confirmam que o Gemini 2.5 Pro é um dos modelos de IA generativa mais impressionantes já vistos.

Assim como os demais modelos do Google, o Gemini 2.5 possui um mecanismo de raciocínio incorporado. A IA realiza uma verificação dos fatos enquanto gera suas respostas – um processo que chamamos de “raciocínio simulado”, pois não há evidências de que seja equivalente ao raciocínio humano. Esse procedimento colabora para a melhoria dos resultados dos modelos. O Google destaca, inclusive, que as capacidades de codificação “agenic” do modelo se beneficiam desse processo. Por exemplo, o Gemini 2.5 Pro Experimental é capaz de gerar um videogame completo a partir de um único comando, algo que foi testado com a versão pública do modelo.

O Gemini 2.5 Pro constrói um jogo em uma única etapa. O Google ressalta que o modelo é mais inteligente, está ciente do contexto e pensa de forma avançada – embora seja difícil mensurar precisamente o que configura uma melhoria nos bots de IA generativa. Entre os pontos técnicos positivos, destaca-se a janela de contexto de 1 milhão de tokens, que embora seja comum entre os grandes modelos Gemini, é consideravelmente maior se comparada a modelos concorrentes como o GPT da OpenAI ou o Claude da Anthropic. Isso possibilita inserir múltiplos livros extensos em um único comando, com uma resposta que pode atingir até 64 mil tokens.

O Google submeteu o Gemini 2.5 Experimental a uma bateria de benchmarks, nos quais o modelo obteve desempenho um pouco superior a outros sistemas de IA. Em testes como o GPQA e o AIME 2025 – que avaliam a capacidade de responder perguntas complexas sobre ciência e matemática – o Gemini ultrapassou discretamente o o3-mini da OpenAI. Em um benchmark composto por 3.000 perguntas elaboradas por especialistas, o modelo estabeleceu um novo recorde, alcançando 18,8% contra 14% do concorrente.

Embora métricas objetivas possam nem sempre captar completamente as capacidades de uma IA, avaliações mais subjetivas também ajudam a evidenciar seu potencial. O excelente desempenho do Gemini 2.5 Pro Experimental em rankings de chatbots demonstra que os usuários, de forma geral, preferem suas respostas em comparação com saídas de outros modelos.

Os testes realizados com o Gemini 2.5 Pro Experimental também são animadores: tarefas complexas, que costumavam confundir os modelos da versão 2.0, agora são tratadas com maior eficiência. Questões relacionadas à programação, matemática e ciência apresentaram resultados bem superiores aos das versões anteriores.

Além disso, o novo modelo do Google se destaca pela velocidade. Embora funcione de forma semelhante aos outros modelos – gerando tokens enquanto “raciocina” uma resposta – o processamento é mais ágil em comparação com as versões mais recentes da OpenAI e da Anthropic. Com vastos recursos computacionais à disposição, o Google consegue oferecer janelas de contexto robustas, cerca de cinco vezes maiores do que o limite de entrada do o3-mini. E isso é só o começo: em breve, a janela de contexto deverá ser ampliada para 2 milhões de tokens.

O modelo 2.0 Pro, que parecia impressionante em seu lançamento, já foi substituído pelo Gemini 2.5 Pro, uma atualização imediata que estará disponível em todos os produtos do Google para os assinantes do Gemini Advanced (US$ 20 mensais). Atualmente, a nova versão pode ser acessada pelo aplicativo móvel, pela web e pelo AI Studio do Google, estando prevista também para ser integrada ao Vertex AI em breve.

Embora o preço da API para o Gemini 2.5 Pro Experimental ainda não tenha sido anunciado, sua utilização está limitada a 50 mensagens diárias, assim como nos modelos experimentais anteriores, e, por ora, está disponível gratuitamente. No entanto, segundo informações divulgadas pelo Google em suas redes, esse modelo será o primeiro experimental a contar com limites e preços de API diferenciados, com novidades a serem anunciadas futuramente.