O burburinho na tecnologia nas últimas semanas tem sido focado diretamente nos modelos de linguagem desenvolvidos e implantados por empresas como Microsoft, Google e OpenAI.
Mas a Meta, empresa controladora do Facebook, continua a fazer um trabalho significativo nesse campo e está lançando um novo gerador de linguagem de IA chamado LLaMA hoje. O LLaMA não é como o ChatGPT ou o Bing; não é um sistema com o qual qualquer pessoa possa conversar.
Em vez disso, é uma ferramenta de pesquisa que a Meta diz que está compartilhando na esperança de “democratizar o acesso neste campo importante e em rápida mudança.Em outras palavras: ajudar os especialistas a desvendar os problemas dos modelos de linguagem de IA, desde o viés e a toxicidade até a tendência de simplesmente inventar informações.
Para esse fim, a Meta está lançando o LLaMA (que na verdade não é um sistema único, mas um quarteto de modelos de tamanhos diferentes) sob “uma licença não comercial focada em casos de uso de pesquisa”, com acesso concedido a grupos como universidades, ONGs e laboratórios da indústria.
“Acreditamos que toda a comunidade de IA — pesquisadores acadêmicos, sociedade civil, formuladores de políticas e indústria — deve trabalhar em conjunto para desenvolver diretrizes claras sobre IA responsável em geral e grandes modelos de linguagem responsáveis em particular”, escreveu a empresa em seu post.
“Estamos ansiosos para ver o que a comunidade pode aprender — e eventualmente construir — usando o LLaMA.”
As capacidades do LLaMa AI da Meta
Em um artigo de pesquisa, Meta afirma que a segunda menor versão do modelo LLaMA, LLaMA-13B, tem um desempenho melhor do que o popular modelo GPT-3 da OpenAI “na maioria dos benchmarks”, enquanto o maior, LLaMA-65B, é “competitivo com os melhores modelos”, como o Chinchilla70B da DeepMind e o PaLM 540B do Google.
(Os números nesses nomes referem-se aos bilhões de parâmetros em cada modelo — uma medida do tamanho do sistema e uma aproximação aproximada de sua sofisticação, embora essas duas qualidades não necessariamente escalem em sintonia.)
Uma vez treinado, o LLaMA-13B também pode ser executado em uma única GPU Nvidia Tesla V100 para data center. Isso será uma boa notícia para instituições menores que desejam realizar testes nesses sistemas, mas não significa muito para pesquisadores solitários para quem esse equipamento está fora de alcance.
O lançamento da Meta também é notável em parte porque perdeu alguns dos burburinhos em torno dos chatbots de IA. (Isso pode não ser uma coisa ruim, no entanto, dada a crítica que a Microsoft recebeu por apressar o lançamento do Bing e a queda no preço das ações do Google depois que seu próprio chatbot cometeu um erro em uma demonstração.)
A Meta lançou seus próprios chatbots de IA acessíveis no passado, mas a recepção foi menos do que estelar. Um, chamado BlenderBot, foi criticado por ser simplesmente… não muito bom, enquanto outro, chamado Galactica, que foi projetado para escrever artigos científicos, foi retirado do ar depois de apenas três dias depois de continuar produzindo absurdos científicos.
Com o quarteto LLaMA, Meta está presumivelmente esperando por uma recepção mais gentil. “Hoje estamos lançando um novo modelo de linguagem de IA de ponta chamado LLaMA, projetado para ajudar os pesquisadores a avançar em seu trabalho”, disse o CEO Mark Zuckerberg em um post no Facebook.
“Os LLMs mostraram muita promessa em gerar texto, ter conversas, resumir material escrito e tarefas mais complicadas, como resolver teoremas matemáticos ou prever estruturas de proteínas. A Meta está comprometida com esse modelo aberto de pesquisa e disponibilizaremos nosso novo modelo para a comunidade de pesquisa de IA.”