DeepSeek aprimora seu modelo de IA voltado à matemática Prover
O laboratório chinês de IA DeepSeek atualizou silenciosamente o Prover, seu modelo de IA desenvolvido para resolver provas e teoremas matemáticos.
De acordo com o South China Morning Post, a DeepSeek disponibilizou a versão mais recente do Prover, a V2, na plataforma de desenvolvimento de IA Hugging Face, ainda na noite de quarta-feira. Aparentemente, essa versão foi construída sobre o modelo V3 da startup, que conta com 671 bilhões de parâmetros e adota uma arquitetura de mistura de especialistas (MoE). Enquanto os parâmetros se relacionam aproximadamente com as habilidades de resolução de problemas do modelo, o MoE divide as tarefas em subtarefas, delegando-as a componentes menores e especializados.
A DeepSeek já havia atualizado o Prover em agosto, na ocasião descrevendo-o como um modelo customizado para a demonstração formal de teoremas e para o raciocínio matemático.
Em fevereiro, a Reuters informou que a DeepSeek estaria considerando captar recursos externos pela primeira vez. Recentemente, a empresa lançou uma versão aprimorada do modelo V3, de uso geral, e deve atualizar em breve seu modelo R1, voltado ao raciocínio.
