Google amplia acesso ao Gemini 2.5 Pro em meio a fortes resultados em benchmarks

O Google ampliou o acesso ao Gemini 2.5 Pro, seu mais recente modelo de inteligência artificial de referência, que demonstra um desempenho impressionante em testes científicos e apresenta uma estrutura de preços competitiva. Segundo o CEO da Alphabet, Sundar Pichai, o Gemini 2.5 Pro representa o “modelo mais inteligente + agora o mais demandado” da empresa. A demanda aumentou mais de 80% somente neste mês, tanto no Google AI Studio quanto na API Gemini. A partir desta semana, os usuários poderão acessar uma prévia pública expandida com limites de uso maiores, incluindo uma opção gratuita. Os usuários do Gemini Web Chat continuarão a ter acesso ao modelo Experimental 2.5 Pro, que deve oferecer desempenho equivalente. A Google planeja mais anúncios durante sua conferência Cloud Next '25, em 9 de abril.

Preços competitivos

A API Gemini 2.5 Pro adota um modelo de preços escalonado. Para prompts de até 200.000 tokens, o custo de entrada é de US$ 1,25 por milhão de tokens, enquanto a saída custa US$ 10. Prompts maiores elevam os valores para US$ 2,50 e US$ 15 por milhão de tokens, respectivamente. Embora o armazenamento em cache de prompts ainda não esteja disponível, mesmo na versão paga, sua futura implementação pode reduzir custos ainda mais.

O Google oferece ancoragem gratuita com o Google Search para até 500 consultas diárias, seguida por 1.500 consultas adicionais gratuitas. Acima desse limite, cada 1.000 consultas custa US$ 35. De acordo com os termos de uso, os dados do plano gratuito poderão ser utilizados para treinamento de IA, enquanto os dados do plano pago não.

Tabela de preços da API Gemini 2.5 Pro

Desempenho forte em testes científicos

O grupo de pesquisa em IA EpochAI reportou que o Gemini 2.5 Pro obteve 84% no benchmark GPQA Diamond – muito acima dos 70% normalmente alcançados por especialistas humanos. O teste apresenta questões de múltipla escolha desafiadoras nas áreas de biologia, química e física, e os resultados independentes do EpochAI confirmam os dados divulgados pela Google.

Desempenho do Gemini 2.5 Pro no benchmark GPQA Diamond

Embora a Google não tenha divulgado detalhes técnicos sobre a arquitetura, os dados de treinamento ou os requisitos computacionais do modelo, sabe-se que ele é um modelo de “raciocínio” similar à série O da OpenAI. O EpochAI ressalta que os testes foram limitados pelas atuais restrições de uso do modelo experimental.

As capacidades do Gemini 2.5 Pro vão além do benchmark GPQA. No desafiador “Último Exame da Humanidade”, o modelo alcançou 18,8% – a maior pontuação entre os modelos sem uso de ferramentas adicionais, superando significativamente concorrentes como o Deepseek-R1, que obteve 9%. Em testes semanais realizados no trackingAI.org, a versão experimental demonstrou capacidades cognitivas impressionantes, alcançando uma média de QI de 130 – bem acima da faixa típica de 90 a 110 observada em outros modelos de linguagem.

Resultados do teste de QI do Gemini 2.5 Pro Experimental

O Gemini 2.5 Pro Experimental obteve a maior pontuação (116) entre todos os modelos de linguagem no teste semanal de QI. Essas avaliações utilizam versões textuais do teste de QI do Mensa norueguês, apresentando as questões de forma verbal em vez de visual, como nos modelos baseados em visão. As perguntas não fazem parte dos dados de treinamento e, caso o modelo hesite, ele tem até dez tentativas antes que a última resposta válida seja registrada.

O novo modelo da Google também recebeu feedback extremamente positivo na rede X. O cientista da computação François Chollet descreve o Gemini 2.5 Pro como seu modelo de trabalho diário, afirmando que ele é o melhor para quase todas as tarefas, exceto geração de imagens, onde também se destaca. Segundo o investidor Martin Casado, ele utiliza o modelo quase exclusivamente para programação. Em uma comparação, Peter Yang classificou o Gemini 2.5 como o melhor modelo para tarefas de programação, enquanto o pesquisador de IA japonês Shane Gu destacou, em particular, a excelente relação custo-benefício, posicionando o Gemini na fronteira de Pareto em todas as categorias de preço.