Na quinta-feira, a Anthropic lançou o Opus 4.8, a versão mais recente do seu modelo avançado disponível publicamente. O modelo está disponível em todas as regiões, mantendo a mesma tabela de preços do lançamento anterior do Opus.
A atualização ocorre apenas 41 dias após o lançamento do Opus 4.7, representando um ciclo de atualizações muito mais rápido do que o habitual para a Anthropic. Os modelos Sonnet e Haiku, por exemplo, foram lançados há três e sete meses, respectivamente. Essa rápida renovação pode ter sido motivada pela recepção fria ao Opus 4.7, que alguns usuários consideraram decepcionante.
Durante esse período, também foram lançadas atualizações importantes para o Codex da OpenAI e para o modelo Gemini Flash do Google, aumentando a pressão para que a Anthropic mantenha o ritmo de inovações no mercado.
O novo lançamento apresenta os resultados esperados em benchmarks de desempenho, mas tem especial atenção à forma como o modelo lida com dados errôneos ou incertos. Nos testes iniciais, os avaliadores constatam que o Opus 4.8 “tende a sinalizar incertezas sobre seu trabalho e é menos propenso a fazer afirmações sem respaldo”.
De forma semelhante, um depoimento de associados da Bridgewater destacou que a principal diferença da atualização foi “a tendência do Opus 4.8 de sinalizar proativamente problemas com as entradas e saídas de uma análise, algo que outros modelos rotineiramente deixavam passar e obrigavam os usuários a identificar”.
Junto com o novo modelo, a Anthropic lançou o recurso Fluxos de Trabalho Dinâmicos, que estará disponível em pré-visualização para pesquisas. Esse sistema foi desenvolvido para auxiliar modelos de maior porte, como o Opus, na gestão de tarefas complexas que envolvem centenas de subagentes em paralelo.
Segundo a empresa, “o Claude Code, aliado ao Opus 4.8, agora pode realizar migrações em grande escala no código – percorrendo desde o lançamento inicial até o merge – utilizando o conjunto de testes já existente como referência.”
A Anthropic ainda está segurando seu modelo mais avançado, o Mythos, após uma prévia cautelosa no mês passado, que levantou preocupações de segurança cibernética. No entanto, a empresa sugeriu que o período de pré-visualização do Mythos pode chegar ao fim em breve, assim que as salvaguardas necessárias forem implementadas.
“Estamos progredindo rapidamente no desenvolvimento dessas medidas de segurança e esperamos poder disponibilizar modelos da classe Mythos para todos os nossos clientes nas próximas semanas”, declarou a empresa.
