DeepSeek viraliza e desafia o mercado de IA
O laboratório chinês de IA DeepSeek ganhou notoriedade depois que seu aplicativo de chatbot alcançou o topo das paradas nas principais lojas de aplicativos. Os modelos de IA da empresa, treinados com técnicas que otimizam o uso de recursos computacionais, despertaram questionamentos de analistas e tecnólogos sobre se os Estados Unidos conseguirão manter sua liderança na corrida da inteligência artificial e se a demanda por chips de IA será sustentada.
Mas de onde veio a DeepSeek e como ela atingiu fama internacional tão rapidamente?
Origens Trader da DeepSeek
A DeepSeek é apoiada pela High-Flyer Capital Management, um fundo hedge quantitativo chinês que utiliza inteligência artificial para fundamentar suas decisões de trading. O entusiasta de IA Liang Wenfeng co-fundou a High-Flyer em 2015 e, após sua experiência com trading enquanto estudante na Universidade de Zhejiang, lançou o fundo hedge focado no desenvolvimento e na implantação de algoritmos de IA em 2019.
Em 2023, a High-Flyer criou a DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, desvinculando essa atividade do seu negócio financeiro. Com a High-Flyer entre os investidores, o laboratório se transformou em uma empresa independente que manteve o mesmo nome.
Desde o início, a DeepSeek investiu na construção de seus próprios clusters de data centers para o treinamento dos modelos. Entretanto, assim como outras empresas de IA na China, ela foi afetada pelas proibições de exportação de hardware impostas pelos Estados Unidos. Para treinar um dos seus modelos mais recentes, a empresa precisou utilizar chips Nvidia H800, uma versão de menor potência em comparação ao chip H100 disponível para empresas norte-americanas.
A equipe técnica da DeepSeek se destaca pela juventude. A empresa recruta ativamente pesquisadores de doutorado em IA das principais universidades chinesas e, além disso, contrata profissionais sem formação em ciência da computação para auxiliar na compreensão de uma ampla gama de assuntos.
Modelos poderosos da DeepSeek
Em novembro de 2023, a DeepSeek apresentou seu primeiro conjunto de modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat. Contudo, foi somente na primavera passada, com o lançamento da família de modelos de próxima geração DeepSeek-V2, que a indústria de inteligência artificial começou a prestar grande atenção à empresa.
O DeepSeek-V2, um sistema versátil de análise de textos e imagens, obteve excelente desempenho em diversos benchmarks, apresentando custos operacionais consideravelmente inferiores aos de modelos comparáveis na época. Esse avanço forçou concorrentes no mercado interno, como ByteDance e Alibaba, a reduzir os preços de alguns de seus modelos e a oferecer outros gratuitamente.
O lançamento do DeepSeek-V3, em dezembro de 2024, consolidou ainda mais a notoriedade da empresa. Testes internos demonstraram que o DeepSeek-V3 supera tanto modelos disponíveis para download e amplamente acessíveis quanto modelos “fechados”, cujo acesso se dá somente via API.
Outro destaque é o modelo de raciocínio R1, lançado em janeiro. A DeepSeek afirma que o R1 apresenta desempenho equivalente ao de modelos de referência em benchmarks importantes. Por ser um modelo de raciocínio, o R1 verifica seus próprios fatos, o que o ajuda a evitar armadilhas comuns em outros sistemas. Embora demore um pouco mais — geralmente alguns segundos a minutos extras — para chegar a soluções, essa abordagem resulta em maior confiabilidade em áreas como física, ciência e matemática.
Uma abordagem disruptiva
O modelo de negócios da DeepSeek ainda não está claro. A empresa precifica seus produtos e serviços bem abaixo do valor de mercado e disponibiliza outros gratuitamente. Segundo a própria DeepSeek, avanços significativos em eficiência permitiram que ela mantivesse uma competitividade extrema em termos de custos. Alguns especialistas, no entanto, questionam os números apresentados pela empresa.
Independente das controvérsias, os desenvolvedores adotaram os modelos da DeepSeek. Embora não sejam de código aberto no sentido estrito, eles estão disponíveis sob licenças permissivas que possibilitam o uso comercial. Houve a criação de mais de 500 modelos derivados do R1 por desenvolvedores, totalizando 2,5 milhões de downloads.
O sucesso da DeepSeek em enfrentar concorrentes maiores e mais estabelecidos foi descrito como uma verdadeira revolução na inteligência artificial, além de ter sido considerado por alguns como um fenômeno superestimado. Seu êxito contribuiu para a queda de 18% no valor das ações da Nvidia em janeiro e provocou reações na comunidade de tecnologia, inclusive de executivos de grandes empresas do setor.
A DeepSeek também passou a integrar serviços em plataformas de nuvem para empresas, reforçando sua presença no mercado. Em paralelo, durante a divulgação dos resultados financeiros de algumas companhias, executivos ressaltaram a importância estratégica dos gastos em infraestrutura de IA. Em uma chamada de resultados, o CEO de uma grande empresa destacou que os avanços dos modelos de raciocínio, como os da DeepSeek, beneficiam não só os próprios desenvolvedores como também empresas de hardware, devido à alta demanda por capacidade computacional.
Ao mesmo tempo, algumas empresas, países e governos estão adotando medidas para banir ou restringir o uso do DeepSeek, citando riscos relacionados à segurança e à influência estrangeira. Diversas nações, incluindo a Coreia do Sul, além do estado de Nova York, já implementaram proibições quanto ao uso do sistema em dispositivos governamentais.
Quanto ao futuro da DeepSeek, melhorias nos modelos já são esperadas, mas o cenário também mostra uma crescente atenção dos governos norte-americanos frente ao que é percebido como uma influência estrangeira potencialmente prejudicial.