Gemini 2.5 Pro: Google finalmente alcançou
O Google DeepMind apresentou o Gemini 2.5 Pro, que a empresa descreve como seu modelo de IA mais capaz até hoje. De acordo com o Google, o novo modelo já lidera diversos testes comparativos com margens significativas, incluindo a Chatbot Arena, que avalia as preferências humanas. Este avanço representa o primeiro grande modelo de raciocínio do Google após os experimentos iniciais com o Flash 2.0 Thinking, com a intenção de integrar essas capacidades em todos os modelos futuros.
Desempenho em Múltiplos Domínios
O Gemini 2.5 Pro demonstra fortes capacidades em diversas áreas. Sem otimizações especializadas, o modelo atinge resultados sólidos em testes matemáticos e científicos, como o GPQA e o AIME, além de ter alcançado 18,8% no desafiador teste “Último Exame da Humanidade” – a maior pontuação entre os modelos que não utilizam ferramentas adicionais.
No campo da programação, o Google destaca o desempenho do Gemini 2.5 Pro no desenvolvimento de aplicações web e na transformação de código. Com uma configuração personalizada, o modelo atinge 63,8% no SWE-Bench Verified, demonstrando inclusive a capacidade de gerar código funcional para jogos a partir de uma única instrução. Contudo, o modelo Claude 3.7 Sonnet Thinking, da Anthropic, ainda supera o Gemini 2.5 Pro nesse aspecto.
Primeiro Verdadeiro Modelo de Raciocínio Multimodal
Assim como seus predecessores, o Gemini 2.5 Pro consegue processar uma variedade de entradas, incluindo texto, áudio, imagens, vídeo e código, algo ainda não igualado por outros modelos. O modelo conta com uma ampla janela de contexto de 1 milhão de tokens, com planos de expandi-la para 2 milhões.
Desenvolvedores e empresas já podem experimentar o Gemini 2.5 Pro por meio do Google AI Studio, e assinantes do Gemini Advanced têm a opção de selecioná-lo em dispositivos desktop e móveis. O Google também planeja anunciar, nas próximas semanas, a disponibilidade do modelo no Vertex AI, juntamente com detalhes de preços.
Resumo:
- O Google DeepMind lançou o Gemini 2.5 Pro, seu modelo de IA mais avançado, que lidera diversos testes comparativos, como a Chatbot Arena.
- O modelo multimodal processa texto, áudio, imagens, vídeo e código e apresenta excelentes resultados em testes matemáticos e científicos, incluindo o “Último Exame da Humanidade”.
- Com uma janela de contexto de 1 milhão de tokens (com planos para expandir para 2 milhões), o Gemini 2.5 Pro já está disponível para desenvolvedores e assinantes do Gemini Advanced, com mais novidades previstas para as próximas semanas.