Lançamento do Gemini 2.5

Na última terça-feira, o Google apresentou o Gemini 2.5, uma nova família de modelos de raciocínio em IA que “pausa para pensar” antes de responder. Para marcar o início dessa nova linha, o Google lançou o Gemini 2.5 Pro Experimental, um modelo multimodal de inteligência e raciocínio, que segundo a empresa, é o seu modelo mais inteligente até o momento. Esse modelo estará disponível na plataforma para desenvolvedores, Google AI Studio, e no aplicativo Gemini, para assinantes do plano avançado de IA da empresa, com custo de US$ 20 por mês.

Raciocínio como Diferencial

Desde que a OpenAI lançou o primeiro modelo de raciocínio em IA em setembro de 2024, as empresas do setor têm buscado igualar ou superar essas capacidades. Hoje, empresas como Anthropic, DeepSeek, Google e xAI já contam com modelos de raciocínio que utilizam maior poder de processamento e tempo para verificar fatos e raciocinar sobre problemas antes de fornecer uma resposta. Essas técnicas de raciocínio têm permitido que os modelos de IA atinjam novos patamares em tarefas de matemática e codificação, e muitos especialistas acreditam que essa habilidade será essencial para os agentes autônomos de IA no futuro.

Desempenho e Benchmarking

O Google afirma que o Gemini 2.5 Pro supera seus modelos de ponta anteriores e alguns dos principais modelos concorrentes em diversos benchmarks. Por exemplo, em um teste de edição de código chamado Aider Polyglot, o Gemini 2.5 Pro alcançou 68,6%, superando os modelos da OpenAI, Anthropic e o laboratório chinês DeepSeek. Em outro teste, o SWE-bench Verified, o modelo obteve 63,8%, performando melhor que o o3-mini da OpenAI e o R1 da DeepSeek, mas ficando atrás do Claude 3.7 Sonnet, da Anthropic, que marcou 70,3%. No teste multimodal denominado Humanity’s Last Exam, que engloba milhares de questões das áreas de matemática, humanidades e ciências naturais, o Gemini 2.5 Pro alcançou 18,8%, superando a maioria dos modelos concorrentes.

Capacidade de Processamento e Futuro

Um dos destaques do Gemini 2.5 Pro é sua janela de contexto de 1 milhão de tokens, o que equivale a aproximadamente 750 mil palavras em uma única análise – um volume maior do que toda a série de livros “O Senhor dos Anéis”. Em breve, o modelo deverá suportar o dobro dessa quantidade, com 2 milhões de tokens. O Google ainda não divulgou os preços para a API do Gemini 2.5 Pro, mas a empresa promete mais informações nas próximas semanas.