DeepWho? DeepSeek Lança Tecnologia de IA Ainda Mais Poderosa e Acessível

DeepSeek atualizou recentemente o seu modelo de IA R1. Com um desempenho superior e mantendo preços abaixo da média dos melhores modelos do mercado, essa atualização passou praticamente despercebida pela indústria de tecnologia e por investidores, diferentemente do grande alvoroço causado no início do ano quando o modelo R1 surpreendeu e abalou o setor.

No lançamento anterior, o modelo gerou um verdadeiro pânico entre investidores e provocou uma queda nas ações de tecnologia, além de levantar dúvidas sobre a viabilidade do boom de gastos com IA generativa. Agora, conforme observou Ross Sandler, analista de tecnologia do Barclays, “o lançamento veio e foi embora sem qualquer impacto. O mercado de ações simplesmente não se preocupa com isso, o que indica que o entendimento sobre o comércio de IA melhorou consideravelmente em apenas cinco meses.”

Liang Wenfeng, fundador da DeepSeek, durante um evento em Xangai

Um Levantamento Não Científico

Em uma breve pesquisa informal com colegas da equipe de tecnologia, as reações foram variáveis, mas a conclusão foi unânime: muitos nem perceberam a atualização. Alguns afirmaram que a conheceram apenas por meio de manchetes rápidas e não deram mais atenção ao assunto, enquanto outros nem notaram o acontecimento. Esse desinteresse entre profissionais ligados às notícias de tecnologia, que estão sempre antenados, reforça a ideia de que o lançamento já passou despercebido.

Por Que Ninguém Dá Muito Valor Agora?

Mesmo sendo considerado um dos três melhores modelos de IA atualmente, o R1 da DeepSeek não gera o mesmo burburinho de lançamentos anteriores. Isso se deve, em parte, à crescente percepção de que os principais modelos de IA apresentam desempenhos relativamente similares, já que foram treinados, em sua maioria, com os mesmos dados disponíveis na internet.

Além disso, a diferença de preço tem se estreitado: antes, o modelo da DeepSeek custava aproximadamente 27 vezes menos que o modelo da OpenAI; agora, essa vantagem é de cerca de 17 vezes. Esses números, extraídos de pesquisas e índices de inteligência artificial, indicam que, quando se trata de desempenho, as inovações acabam sendo rapidamente absorvidas e replicadas pela concorrência.

Outro ponto importante é a distribuição. Enquanto empresas com acesso a contas corporativas de ferramentas como o ChatGPT ou usuários de smartphones Android tendem a optar por soluções já integradas em suas plataformas, a DeepSeek ainda não possui uma distribuição ampla, especialmente no mundo ocidental.

Infraestrutura de IA e o Desafio dos Modelos de Raciocínio

Os modelos de “raciocínio”, como o R1 da DeepSeek e os modelos avançados da OpenAI, exigem uma quantidade massiva de poder computacional para decompor requisições em múltiplas etapas de “pensamento”. Cada etapa gera novos tokens que devem ser processados em larga escala. O alvoroço gerado em janeiro se deveu, em grande parte, à preocupação de que a DeepSeek tivesse desenvolvido modelos mais eficientes, exigindo menos infraestrutura computacional.

No entanto, ironicamente, esses modelos de raciocínio podem acabar demandando ainda mais GPUs e outros equipamentos de computação para sua execução, tornando o equilíbrio entre desempenho e custo de operação um dos grandes desafios do setor.