China está ficando para trás na corrida da IA, segundo parâmetro do governo dos EUA

Um novo relatório do Center for AI Standards and Innovation (CAISI) afirma que os modelos de inteligência artificial chineses estão perdendo terreno em relação aos seus equivalentes nos Estados Unidos. A agência testou recentemente o novo modelo chinês de pesos abertos Deepseek V4 Pro, e o veredicto foi que ele está cerca de oito meses atrasado em comparação com os principais modelos americanos. O CAISI avaliou o desempenho da ferramenta em áreas como cibersegurança, desenvolvimento de software, matemática, ciências naturais e raciocínio abstrato.

Embora o Deepseek V4 seja considerado o modelo de IA mais capaz produzido na China até o momento, testes privados indicam que seu desempenho pode ser inferior ao que o próprio relatório técnico do Deepseek sugere. Enquanto a empresa posiciona o modelo como estando aproximadamente no mesmo patamar de modelos americanos atuais, como o Opus 4.6 e o GPT-5.4, o CAISI aponta que sua performance está, na verdade, mais próxima da versão anterior do GPT-5 – com destaque para as áreas de raciocínio abstrato, cibersegurança e desenvolvimento de software. Em matemática, o Deepseek V4 chega quase a equiparar-se aos principais modelos dos EUA.

CAIST overall AI Capability us china scaled 1

De acordo com o CAISI, a lacuna entre os modelos americanos e chineses continua a se alargar, com o Deepseek V4 Pro posicionando-se no nível do GPT-5, lançado oito meses antes. Um índice independente de inteligência, elaborado pela Artificial Analysis, apresenta uma narrativa diferente, indicando que a disparidade entre os modelos dos dois países se manteve relativamente constante ao longo do tempo.

AA overall AI Capability us china

O preço pode começar a importar mais do que a capacidade bruta

Em termos de custo, o Deepseek V4 possui uma vantagem clara. Ele se mostrou mais econômico que seu comparável, o GPT-5.4 mini, em cinco dos sete testes realizados. O fator preço está se tornando cada vez mais relevante, especialmente à medida que os modelos de IA devem operar por períodos mais longos e lidar com tarefas cada vez mais complexas.

Essa questão se torna ainda mais pertinente, pois ainda não há maneiras confiáveis de medir o real aumento de produtividade proporcionado por esses modelos, considerando também efeitos indiretos como treinamentos, aprimoramento de habilidades e processos de verificação de erros. Assim, em um cenário em que se alcança um determinado patamar de desempenho, uma performance “boa o suficiente” a um baixo custo pode se mostrar mais atrativa do que um desempenho de alto nível cobrado a preços premium.

Por exemplo, o Cursor – concorrente do Claude Code – construiu seu modelo customizado para codificação com base em um modelo chinês de código aberto, tornando-o significativamente mais econômico do que as soluções oferecidas pela OpenAI e pela Anthropic. Em declarações recentes, o CEO da OpenAI, Sam Altman, demonstrou certa indecisão entre tornar os modelos mais baratos e rápidos ou investir em sua inteligência, ressaltando que, por mais que a velocidade e o custo sejam fatores importantes, ser mais inteligente ainda é fundamental.

Além disso, essa visão pode estar fundamentada na hipótese de que uma IA mais inteligente teria a capacidade de se aprimorar, acelerando o progresso tecnológico de forma geral. Desenvolvedores, tanto americanos quanto chineses, afirmam que os seus modelos já estão impulsionando significativamente os esforços de pesquisa e desenvolvimento em suas respectivas áreas.