AI2 lança Dolma, o maior conjunto de dados de código aberto para Modelos de Linguagem (LLMs)
O Instituto Allen para a Inteligência Artificial (AI2) apresentou o Dolma, um conjunto de dados de código aberto com três trilhões de tokens, provenientes de