Pesquisadores do Google Deepmind demonstram o Promptbreeder, um sistema de IA que pode melhorar a si mesmo gerando recursivamente melhores prompts.
O desenvolvimento de instruções de linguagem natural (prompts), também conhecido como engenharia de prompts, é uma técnica chave para melhorar as capacidades de modelos de linguagem grande, como o GPT-4. No entanto, o processo é demorado, muitas vezes não intuitivo e os resultados nem sempre são reproduzíveis. O Promptbreeder automatiza a engenharia imediata, gerando melhores prompts em gerações sucessivas usando um algoritmo evolutivo.
O sistema começa com um conjunto inicial de prompts que são pontuados com base no desempenho do modelo em tarefas lógicas envolvendo esses prompts. Os prompts de alta pontuação são mutados de acordo com certas regras especificadas em “Prompts de mutação” para gerar novas variações de prompt, enquanto os prompts de baixa pontuação são descartados. Esse processo recursivo permite que o Promptbreeder explore um grande espaço de prompt e descubra prompts altamente eficazes para diferentes domínios.
Crucialmente, o Promptbreeder também é autorreferenciado – ele não apenas desenvolve prompts de tarefa melhores, mas também prompts de mutação melhores que controlam como os prompts de tarefa são variados. Dessa forma, o sistema também melhora seu próprio processo de busca e se torna mais eficiente na criação de prompts ao longo do tempo.
Promptbreeder encontra melhores prompts – e se tornará muito mais importante no futuro
Os pesquisadores testaram Promptbreeder em tarefas de aritmética, raciocínio e classificação de discurso de ódio. Eles consistentemente superaram as técnicas tradicionais de solicitação manual, como a “cadeia de pensamento”. Os prompts desenvolvidos eram muitas vezes contraintuitivos e específicos do domínio, como o prompt “SOLUTION” antes de uma tarefa matemática, que superava até mesmo o recém-descoberto prompt “respire fundo”.
Imagem: Fernando et al.
A arquitetura autorreferencial é fundamental para o sucesso, diz a equipe, porque os testes mostraram que remover qualquer capacidade de auto-melhoria degrada significativamente o desempenho.
Iterações futuras podem permitir que o Promptbreeder desenvolva estratégias lógicas mais complexas e gerais que vão além de pistas específicas da tarefa. À medida que os modelos de linguagem se tornam maiores e mais poderosos, os benefícios potenciais de estratégias rápidas também aumentarão, disseram eles.
“Acredito que o futuro será selvagem, pois veremos sistemas de autoaperfeiçoamento autorreferenciais cada vez mais abertos que continuam a escalar com LLMs cada vez maiores e mais capazes. O desenvolvimento de tal sistema é um “santo graal da pesquisa de IA”, acrescenta.