DeepSeek viraliza e desafia o mercado de IA

Esta semana, o aplicativo de chatbot da DeepSeek atingiu o topo das paradas nas lojas de aplicativos, despertando debates sobre a liderança dos Estados Unidos na corrida da inteligência artificial e a sustentabilidade da demanda por chips de IA.

Origens do DeepSeek no mercado financeiro

A DeepSeek tem seu apoio pelo High-Flyer Capital Management, um fundo de hedge quantitativo chinês que utiliza inteligência artificial para orientar suas decisões de investimento. Em 2015, o entusiasta de IA Liang Wenfeng co-fundou o High-Flyer, tendo iniciado sua trajetória no trading enquanto cursava a Universidade de Zhejiang. Em 2019, o fundo passou a se concentrar no desenvolvimento e aplicação de algoritmos de IA, e em 2023, a DeepSeek foi lançada como um laboratório focado em pesquisas sobre ferramentas de inteligência artificial, desmembrando-se progressivamente das atividades financeiras.

Desde o início, a DeepSeek investiu na construção de seus próprios clusters de data center para treinamento de modelos. No entanto, assim como outras empresas chinesas de IA, ela foi afetada pelas restrições de exportação de hardware impostas pelos Estados Unidos. Para treinar um de seus modelos mais recentes, a companhia precisou recorrer a chips Nvidia H800, uma versão menos potente do popular H100.

A equipe técnica da DeepSeek é predominantemente jovem. A empresa adota uma postura agressiva na contratação de pesquisadores doutorados em inteligência artificial das melhores universidades chinesas e chegou a empregar profissionais sem formação em ciência da computação para ampliar a capacidade de compreensão dos modelos em diversos temas.

Modelos de destaque e inovações

Em novembro de 2023, a DeepSeek apresentou seus primeiros modelos – Coder, LLM e Chat – mas foi com o lançamento da família DeepSeek-V2, na primavera, que o setor de IA começou a prestar maior atenção. Este sistema de análise de texto e imagem se destacou não apenas pelo desempenho em diversos benchmarks, mas também pelo custo operacional significativamente inferior se comparado a modelos similares, impulsionando concorrentes locais a revisar seus preços e a oferecer alguns serviços gratuitamente.

O lançamento do DeepSeek-V3, em dezembro de 2024, reforçou o prestígio da empresa, com resultados que superam tanto modelos populares de código aberto quanto soluções “fechadas” acessíveis apenas via API. Outro destaque é o modelo de “raciocínio” R1, lançado em janeiro, que se diferencia por sua habilidade de realizar verificações internas e evitar erros comuns em abordagens tradicionais. Ainda que sua resposta demore alguns segundos ou minutos a mais, o R1 oferece uma confiabilidade superior em áreas como física, ciência e matemática.

Por ser desenvolvido na China, os modelos da DeepSeek passam por avaliações regulatórias que verificam se suas respostas refletem os valores fundamentais do país, o que leva a limitações em temas sensíveis, como a Praça Tiananmen ou a autonomia de Taiwan. Mesmo diante de concorrência acirrada, a DeepSeek tem mostrado crescimento significativo, com milhões de visitas mensais e constantes atualizações em seus modelos.

Uma abordagem disruptiva

O modelo de negócios da DeepSeek ainda não está completamente definido, mas a estratégia de oferecer produtos e serviços a preços bem inferiores aos praticados no mercado – e até mesmo gratuitamente – destaca a empresa, que segue sem recorrer a investimentos de capital de risco, apesar do forte interesse dos investidores.

Avanços em eficiência permitiram que a DeepSeek mantivesse uma competitividade extrema em custos, ainda que certos especialistas questionem os números divulgados. Desenvolvedores têm se beneficiado dos modelos da empresa, que, mesmo não sendo de código aberto em seu sentido tradicional, estão disponíveis sob licenças permissivas que possibilitam usos comerciais. Em plataformas de desenvolvedores, já foram criadas centenas de versões derivadas do modelo R1, acumulando milhões de downloads.

O sucesso da DeepSeek tem sido considerado revolucionário para o setor de inteligência artificial, provocando impactos significativos no mercado e incentivando reações de grandes players. Entretanto, a preocupação com a segurança dos dados e a influência estrangeira tem levado diversas empresas, países e governos a banir seu uso em dispositivos oficiais, o que adiciona incertezas ao futuro da companhia.