Os modelos de IA estão sendo desenvolvidos em ritmo acelerado, tanto por gigantes da tecnologia como o Google, quanto por startups como a OpenAI e a Anthropic. Acompanhar as últimas novidades pode ser um verdadeiro desafio.

Além disso, os modelos de IA costumam ser promovidos com base em benchmarks da indústria, mas essas métricas técnicas frequentemente revelam pouco sobre como pessoas e empresas utilizam essas tecnologias na prática.

Para descomplicar, foi elaborado um panorama dos modelos de IA mais avançados lançados desde 2024, com detalhes sobre suas melhores aplicações e modos de uso. Vale lembrar que essa lista será constantemente atualizada à medida que novos lançamentos surgirem.

Com mais de um milhão de modelos de IA disponíveis hoje em dia, é possível que alguns que se destacam em determinados aspectos não estejam incluídos nesta seleção.

Modelos de IA lançados em 2025

Google Gemini 2.5

O Gemini 2.5 Pro Experimental, um modelo focado no raciocínio, se destaca na criação de aplicativos web e agentes de código. Ainda que não alcance o desempenho de certos benchmarks de codificação quando comparado a outros modelos, como o Claude Sonnet 3.7, o Google o recomenda para quem precisa dessas funções. Seu uso exige uma assinatura mensal do Gemini Advanced, no valor de US$ 20.

ChatGPT-4o Gerador de Imagens

A OpenAI aprimorou seu modelo existente, que agora não só gera texto, mas também imagens. Esse modelo ganhou popularidade ao transformar imagens em um estilo semelhante ao do Studio Ghibli, apesar das preocupações óbvias relacionadas aos direitos autorais. Para utilizá-lo, é necessário assinar o ChatGPT Plus, com uma mensalidade mínima de US$ 20.

Câmera Virtual Estável da Stability AI

A startup de geração de imagens Stability AI lançou um modelo capaz de transformar uma única imagem 2D em cenas tridimensionais com diversos ângulos de câmera. Apesar de ter dificuldades com cenas que envolvem elementos mais complexos, como figuras humanas e água em movimento, o modelo está disponível para uso em pesquisas não comerciais.

Aya Vision da Cohere

A Cohere apresentou o Aya Vision, um modelo multimodal que se destaca na criação de legendas para imagens e na resposta a perguntas sobre fotografias. Além disso, o modelo oferece um desempenho superior em idiomas diferentes do inglês e pode ser utilizado gratuitamente.

GPT 4.5 “Orion” da OpenAI

O Orion é o maior modelo desenvolvido até agora pela OpenAI, reconhecido por seu vasto conhecimento e inteligência emocional. Apesar de apresentar performance inferior em alguns benchmarks quando comparado a modelos de raciocínio mais recentes, ele está disponível para assinantes do plano OpenAI, cujo custo é de US$ 200 mensais.

Claude Sonnet 3.7

Segundo a Anthropic, esse é o primeiro modelo de raciocínio “híbrido” da indústria, capaz de oferecer respostas rápidas e também aprofundar o raciocínio quando necessário. Com a vantagem de permitir ao usuário definir o tempo de processamento, o modelo está acessível a todos, embora usuários mais exigentes necessitem de um plano Pro de US$ 20 mensais.

Grok 3 da xAI

O Grok 3 representa o modelo principal mais recente da startup xAI, fundada por Elon Musk. A empresa alega que ele supera outros modelos líderes em áreas como matemática, ciências e programação. Seu uso requer a assinatura do X Premium, custando US$ 50 mensais. Após estudos indicarem algum viés político, foram feitos esforços para tornar o modelo mais neutro, embora os resultados ainda sejam analisados.

O3-mini da OpenAI

Otimizando tarefas relacionadas à programação, matemática e ciências, o O3-mini da OpenAI é um modelo de raciocínio voltado para desafios STEM. Apesar de não ser o modelo mais robusto da empresa, seu formato reduzido possibilita custos muito mais baixos. Ele está disponível gratuitamente, embora usuários de grande demanda possam necessitar de uma assinatura adicional.

Deep Research da OpenAI

Desenvolvido para conduzir pesquisas aprofundadas com referências claras, o Deep Research é uma ferramenta ideal para explorar temas diversos, desde ciência até análise de mercado. O serviço, entretanto, está disponível apenas mediante a assinatura do ChatGPT Pro, no valor de US$ 200 mensais, e ainda pode apresentar problemas como a geração de informações imprecisas.

Mistral Le Chat

A Mistral lançou versões para aplicativo do Le Chat, um assistente pessoal de IA multimodal que se destaca pela rapidez nas respostas. Disponível também em uma versão paga, que oferece acesso a jornalismo atualizado, o modelo demonstrou resultados positivos em testes, embora com uma incidência maior de erros quando comparado a outros chatbots, como o ChatGPT.

Operator da OpenAI

Projetado para funcionar como um assistente pessoal autônomo capaz de, por exemplo, ajudar nas compras, o Operator da OpenAI atua quase como um estagiário digital. Contudo, estando em fase experimental, já foram registrados casos em que o modelo executou tarefas inesperadas. Seu acesso requer a assinatura do ChatGPT Pro, com custo de US$ 200 mensais.

Google Gemini 2.0 Pro Experimental

O aguardado principal modelo do Google Gemini se mostra eficiente tanto na programação quanto na compreensão de conhecimentos gerais. Com uma janela de contexto super ampla, permitindo o processamento de até 2 milhões de tokens, ele facilita o trabalho com grandes volumes de texto. Para utilizar esse serviço, é necessário, no mínimo, a assinatura do Google One AI Premium, que custa US$ 19,99 mensais.

Modelos de IA lançados em 2024

DeepSeek R1

O modelo chinês DeepSeek R1 causou grande alvoroço no Vale do Silício ao demonstrar bom desempenho em programação e matemática. Por ser open source, pode ser executado localmente por qualquer usuário e oferecido gratuitamente. No entanto, ele integra mecanismos de censura do governo chinês e enfrenta restrições crescentes devido ao envio de dados dos usuários para a China.

Gemini Deep Research

Esse serviço resume os resultados das buscas do Google em um documento objetivo e bem referenciado, sendo especialmente útil para estudantes e pesquisadores que necessitam de resumos rápidos. Embora prático, sua qualidade ainda não substitui o rigor de um artigo científico revisado por pares. Para utilizá-lo, é necessário assinar o Google One AI Premium por US$ 19,99 mensais.

Meta Llama 3.3 70B

A versão mais recente dos modelos de código aberto Llama, da Meta, é considerada a mais econômica e eficiente já lançada, especialmente em tarefas de matemática, conhecimento geral e seguimento de instruções. O modelo é gratuito e de acesso livre.

OpenAI Sora

O Sora é um modelo capaz de criar vídeos realistas a partir de uma descrição em texto. Embora consiga gerar cenas completas, em vez de simples clipes, a OpenAI admite que ele pode produzir física irrealista. No momento, sua utilização está restrita às versões pagas do ChatGPT, sendo o plano Plus, a partir de US$ 20 mensais, o requisito mínimo.

Alibaba Qwen QwQ-32B-Preview

Esse modelo se destaca em benchmarks de matemática e programação, chegando a rivalizar com outros modelos de renome. Apesar de seu foco em raciocínio, apresenta deficiências no senso comum e ainda integra mecanismos de censura do governo chinês. O modelo é disponibilizado gratuitamente e em código aberto.

Computer Use da Anthropic

Desenvolvido para assumir o controle do computador e executar tarefas como programação ou reserva de passagens, o Computer Use do Claude posiciona-se como um antecessor ao Operator da OpenAI. Ainda que a funcionalidade esteja em beta, o serviço é cobrado através de API, com tarifas estabelecidas por milhão de tokens utilizados na entrada e na saída.

Grok 2 da xAI

A xAI, empresa de IA de Elon Musk, lançou uma versão aprimorada do seu chatbot principal, o Grok 2, considerado “três vezes mais rápido” que seu antecessor. Usuários gratuitos têm um limite de 10 perguntas a cada duas horas, enquanto os assinantes dos planos Premium e Premium+ desfrutam de limites mais altos. Além disso, a xAI apresentou o Aurora, um gerador de imagens capaz de produzir fotografias altamente realistas, inclusive com conteúdos gráficos e violentos.

OpenAI o1

A família o1 da OpenAI foi concebida para melhorar a qualidade das respostas por meio de um processo de raciocínio oculto durante a formulação das respostas. O modelo se destaca em áreas como programação, matemática e segurança, embora também enfrente desafios relacionados à tentativa de ludibriar os usuários. Seu acesso está condicionado à assinatura do ChatGPT Plus, que custa US$ 20 mensais.

Claude Sonnet 3.5

Destacado pela Anthropic como um modelo de referência, o Claude Sonnet 3.5 ganhou notoriedade por sua capacidade em programação, consolidando-se como a escolha preferencial entre os entusiastas de tecnologia. Ele pode ser acessado sem custo, mas usuários com demandas mais intensas necessitam de um plano Pro de US$ 20 mensais. Apesar de compreender imagens, o modelo não gera conteúdos visuais.

OpenAI GPT 4o-mini

Apresentado como o modelo mais acessível e rápido da OpenAI, o GPT 4o-mini, devido ao seu tamanho reduzido, é ideal para uma ampla gama de tarefas simples, como a operação de chatbots de atendimento ao cliente. Ele está disponível na versão gratuita do ChatGPT, mas seu desempenho é mais adequado para demandas em alto volume de tarefas simples do que para desafios mais complexos.

Command R+ da Cohere

O modelo Command R+ da Cohere se destaca em aplicações corporativas que envolvem a geração de conteúdo apoiada na recuperação de informações, conseguindo localizar e citar detalhes específicos com precisão. Mesmo com esse recurso, os desafios relacionados às “alucinações” dos modelos de IA ainda persistem.