O novo pequeno modelo de IA da Ai2 supera modelos de tamanho semelhante do Google e Meta
Na quinta-feira, a Ai2, instituto de pesquisa em IA sem fins lucrativos, lançou o Olmo 2 1B, um modelo de 1 bilhão de parâmetros que, segundo a instituição, supera modelos de tamanho semelhante do Google, Meta e Alibaba em diversos benchmarks. Parâmetros, ou pesos, são os componentes internos de um modelo que determinam seu comportamento.
O Olmo 2 1B está disponível sob a licença permissiva Apache 2.0 na plataforma de desenvolvimento de IA Hugging Face. Ao contrário da maioria dos modelos, ele pode ser replicado do zero, pois a Ai2 forneceu o código e os conjuntos de dados (Olmo-mix-1124, Dolmino-mix-1124) utilizados para seu desenvolvimento.
Modelos pequenos podem não ser tão robustos quanto seus equivalentes gigantes, mas, fundamentalmente, não exigem hardware de alto desempenho para funcionar. Isso os torna muito mais acessíveis para desenvolvedores e entusiastas que trabalham com as limitações de máquinas de entrada ou de consumo.
Nos últimos dias, diversos modelos pequenos foram lançados, como a família Phi 4, da Microsoft, voltada para o raciocínio, e o Qwen’s 2.5 Omni 3B. Assim como esses, o Olmo 2 1B pode ser executado facilmente em um laptop moderno ou até mesmo em dispositivos móveis.
A Ai2 afirma que o Olmo 2 1B foi treinado com um conjunto de dados composto por 4 trilhões de tokens provenientes de fontes disponíveis publicamente, geradas por IA e elaboradas manualmente. Tokens são as unidades básicas de dados que os modelos processam e geram — 1 milhão de tokens equivale a cerca de 750 mil palavras.
Em um benchmark que avalia o raciocínio aritmético (GSM8K), o Olmo 2 1B apresentou desempenho superior ao Gemma 3 1B do Google, ao Llama 3.2 1B do Meta e ao Qwen 2.5 1.5B da Alibaba. Além disso, ele supera esses três modelos no teste TruthfulQA, que mede a precisão factual.
A Ai2 alerta que o Olmo 2 1B apresenta riscos. Assim como todos os modelos de IA, ele pode produzir resultados problemáticos, incluindo conteúdo prejudicial e sensível, bem como declarações factualmente imprecisas. Por esses motivos, a Ai2 recomenda não utilizar o modelo em ambientes comerciais.