DeepSeek viralizou
A DeepSeek surpreendeu o público. O laboratório de IA chinês ganhou notoriedade esta semana depois que seu aplicativo chatbot alcançou o topo das paradas na Apple App Store e no Google Play.
As origens de trading da DeepSeek
A DeepSeek conta com o apoio da High-Flyer Capital Management, um fundo quantitativo chinês que utiliza a IA para orientar suas decisões de investimento. Liang Wenfeng, entusiasta de IA, co-fundou a High-Flyer em 2015. Segundo relatos, Wenfeng começou a se envolver com trading ainda estudante na Universidade de Zhejiang e lançou a High-Flyer Capital Management como um fundo de hedge em 2019, com foco no desenvolvimento e implantação de algoritmos de IA.
Em 2023, a High-Flyer criou a DeepSeek como um laboratório dedicado à pesquisa de ferramentas de IA, desvinculando-a do negócio financeiro. Com a High-Flyer entre seus investidores, o laboratório se transformou em uma empresa independente, mantendo o mesmo nome.
Desde o início, a DeepSeek montou seus próprios clusters de data centers para treinamento de modelos. Contudo, assim como outras empresas chinesas de IA, ela foi impactada pelas proibições de exportação de hardware impostas pelos EUA. Para treinar um de seus modelos mais recentes, a companhia precisou utilizar chips Nvidia H800, uma versão menos potente do H100, disponível para empresas norte-americanas.
O time técnico da DeepSeek é conhecido por ser jovem. A empresa recruta de forma agressiva pesquisadores de doutorado em IA das melhores universidades chinesas e também contrata profissionais sem formação em ciência da computação para que sua tecnologia compreenda uma ampla gama de assuntos, de acordo com o The New York Times.
Os modelos avançados da DeepSeek
Em novembro de 2023, a DeepSeek apresentou seu primeiro conjunto de modelos — DeepSeek Coder, DeepSeek LLM e DeepSeek Chat. Contudo, foi somente na primavera do ano passado, com o lançamento da família de modelos DeepSeek-V2 de nova geração, que a indústria de IA passou a prestar maior atenção à empresa.
O DeepSeek-V2 é um sistema de uso geral para análise de texto e imagens que obteve bom desempenho em diversos benchmarks de IA, com custos operacionais muito inferiores aos dos modelos concorrentes. Isso fez com que concorrentes domésticos, como ByteDance e Alibaba, reduzissem os preços de alguns de seus modelos e oferecessem outros de forma gratuita.
O lançamento do DeepSeek-V3, em dezembro de 2024, só ampliou a notoriedade da empresa. Testes internos apontam que o DeepSeek V3 supera tanto modelos de acesso aberto, como o Llama, da Meta, quanto modelos “fechados”, acessíveis apenas via API, como o GPT-4o, da OpenAI.
Outro destaque é o modelo de “raciocínio” R1. Lançado em janeiro, a DeepSeek afirma que o R1 tem desempenho comparável ao modelo o1 da OpenAI em benchmarks importantes. Por ser um modelo de raciocínio, o R1 realiza autoverificação de fatos, o que o ajuda a evitar alguns dos erros comuns em outros sistemas. Embora esses modelos demorem um pouco mais — alguns segundos ou minutos a mais — para chegar a uma solução, eles costumam ser mais confiáveis em áreas como física, ciências e matemática.
Entretanto, os modelos R1, DeepSeek V3 e outros da empresa possuem uma particularidade: por serem desenvolvidos na China, estão sujeitos a avaliações realizadas pelo regulador da internet do país, de forma a garantir que suas respostas incorporem os valores socialistas centrais. Por exemplo, no aplicativo chatbot da DeepSeek, o R1 se recusa a responder questões sobre a Praça Tiananmen ou a autonomia de Taiwan.
Uma abordagem disruptiva
Embora o modelo de negócio da DeepSeek ainda não esteja muito claro, a empresa precifica seus produtos e serviços bem abaixo do valor de mercado e oferece alguns deles gratuitamente, sem recorrer a investimentos de capital de risco, mesmo diante do grande interesse dos investidores.
Segundo a própria DeepSeek, avanços em eficiência permitiram que ela mantivesse uma competitividade extrema em custos. No entanto, alguns especialistas questionam os números divulgados pela empresa.
Independentemente disso, os desenvolvedores passaram a adotar os modelos da DeepSeek. Embora não sejam open source no sentido tradicional, eles estão disponíveis sob licenças permissivas que permitem o uso comercial. Em uma plataforma que hospeda os modelos da DeepSeek, desenvolvedores já criaram mais de 500 modelos “derivados” do R1, que juntos acumularam 2,5 milhões de downloads.
O sucesso da DeepSeek em enfrentar rivais maiores e mais estabelecidos tem sido descrito tanto como uma revolução na IA quanto como algo superestimado. O êxito da empresa foi, ao menos em parte, responsável por uma queda de 18% no valor das ações da Nvidia em janeiro, além de ter provocado uma resposta pública do CEO da OpenAI, Sam Altman. Em março, agências do Departamento de Comércio dos EUA instruíram que a DeepSeek fosse proibida em dispositivos governamentais.
A Microsoft anunciou que a DeepSeek está disponível em seu serviço Azure AI Foundry, que reúne recursos de IA para empresas em uma única plataforma. Durante uma ligação sobre os resultados do primeiro trimestre, o CEO da Meta afirmou que os investimentos em infraestrutura de IA continuarão sendo uma “vantagem estratégica”. Já em março, a OpenAI classificou a DeepSeek como “subsidiada pelo Estado” e “controlada pelo Estado”, sugerindo que o governo dos EUA deveria considerar a proibição de modelos oriundos da empresa.
Na chamada de resultados do quarto trimestre da Nvidia, o CEO Jensen Huang destacou a “excelente inovação” da DeepSeek, afirmando que ela e outros modelos de raciocínio são benéficos para a empresa, pois demandam muito mais poder computacional.
Ao mesmo tempo, algumas empresas, países — como a Coreia do Sul — e governos, inclusive o estado de Nova York, estão proibindo o uso da DeepSeek em dispositivos institucionais.
Quanto ao futuro da DeepSeek, embora melhorias nos modelos sejam garantidas, ainda não se sabe ao certo o que a empresa reserva. O governo dos EUA parece cada vez mais cauteloso diante do que considera uma influência estrangeira prejudicial. Em março, o The Wall Street Journal noticiou que é provável que os dispositivos governamentais nos EUA venham a ter a DeepSeek proibida.
Esta história foi originalmente publicada em 28 de janeiro de 2025 e será atualizada periodicamente.