Google atualiza modelos Gemini 2.5 Flash para respostas mais rápidas e desempenho aprimorado
O Google lançou novas versões de pré-visualização dos seus modelos leves Gemini 2.5 Flash e Flash Lite, que ainda estão em fase experimental. Agora, ambos oferecem tempos de resposta mais rápidos, maior eficiência no manuseio de multimídia e capacidade para lidar com tarefas mais complexas, tudo isso com menor consumo de tokens.
Segundo o Artificial Analysis Index, as atualizações proporcionam melhor desempenho nos benchmarks, com respostas mais ágeis e menor uso de tokens, o que reduz os custos operacionais. Apesar de os preços permanecerem os mesmos, essa redução no consumo de tokens torna a implantação dos modelos mais econômica.

De acordo com o Google, o novo modelo Gemini 2.5 Flash Lite está mais apto a seguir instruções complexas e comandos do sistema, produzindo respostas mais curtas e precisas, o que diminui o custo por token e reduz a latência. Além disso, apresenta melhorias em tarefas multimodais, como transcrição de áudio, análise de imagens e tradução.
No caso do Gemini 2.5 Flash maior, a atualização potencializa o uso de ferramentas externas em tarefas multifásicas. A empresa reporta um aumento no benchmark SWE-Bench Verified, passando de 48,9% para 54%, demonstrando maior eficácia na resolução de problemas reais de desenvolvimento de software.
Ambos os modelos também se beneficiam do recurso “Thinking”, que, ao ser ativado, gera saídas de qualidade superior utilizando menos tokens, acelerando as respostas e reduzindo os custos.

Como usar Gemini 2.5 Flash e Flash Lite
Os novos modelos já estão disponíveis no Google AI Studio e no Vertex AI. Para experimentá-los, utilize os seguintes IDs:
- Flash Lite: gemini-2.5-flash-lite-preview-09-2025
- Flash: gemini-2.5-flash-preview-09-2025
O Google está implementando também um sistema de alias para facilitar o acesso às versões mais recentes. Com os aliases gemini-flash-latest e gemini-flash-lite-latest, a referência será sempre à versão mais atual, dispensando atualizações manuais. Contudo, para condições estáveis, recomenda-se utilizar os nomes fixos dos modelos (gemini-2.5-flash e gemini-2.5-flash-lite), já que preços, funcionalidades e limites podem ser ajustados para os aliases.
Detalhes de preços
| Modelo | Tokens de entrada (texto/imagem/vídeo) | Tokens de entrada (áudio) | Tokens de saída (incluindo “thinking tokens”) |
|---|---|---|---|
| Gemini 2.5 Flash | $0,30 por 1 milhão | $1,00 por 1 milhão | $2,50 por 1 milhão |
| Gemini 2.5 Flash Lite | $0,10 por 1 milhão | $0,30 por 1 milhão | $0,40 por 1 milhão |
Requisições via API em lote são cobradas com 50% do preço padrão interativo. Para mais detalhes, consulte a lista de preços oficial da Gemini API.
Resumo
- O Google lançou versões de pré-visualização dos modelos leves Gemini 2.5 Flash e Flash Lite, que agora apresentam maior eficiência, melhor desempenho em tradução, capacidade para tarefas mais complexas e aprimoramentos em tarefas multimodais.
- O Gemini 2.5 Flash Lite segue instruções complexas de forma mais eficaz, produzindo respostas mais curtas e precisas ao mesmo tempo que melhora o desempenho na transcrição de áudio, análise de imagens e tradução.
- O modelo maior, Gemini 2.5 Flash, utiliza melhor as ferramentas externas em tarefas multi-etapas, alcançando um desempenho superior no benchmark SWE-Bench Verified.