Modelos de linguagem podem acelerar e automatizar muitas tarefas em áreas como texto ou código. O que acontece quando eles correm sozinhos?

Essa nova tendência na IA gerativa também é chamada de “auto-prompting” ou “auto-prompting”. O modelo de linguagem desenvolve e executa prompts que podem levar a novos prompts com base em uma entrada inicial.

Quando combinado com ferramentas como pesquisa na Internet ou a capacidade de gerar código, essa abordagem se torna realmente poderosa. Dessa forma, o modelo de linguagem se torna um assistente automatizado que pode fazer muito mais do que apenas gerar texto ou código.

“1 chamada GPT é um pouco como 1 pensamento. Amarrá-los em loops cria agentes que podem perceber, pensar e agir, seus objetivos definidos em inglês em prompts ”, escreve Andrej Karpathy, desenvolvedor do OpenAI, prevendo um futuro de “AutoOrgs” composto por“AutoCEOs ”,“AutoCFOs ” e assim por diante.

Confira a análise completa da ferramenta e como usar o AutoGPT.

Auto-GPT: Auto-Prompting é a última tendência em grandes modelos de linguagem

O exemplo mais popular de auto-prompting no momento é o aplicativo experimental de código aberto “Auto-GPT”. De acordo com a equipe do Github, o aplicativo Python é projetado para desenvolver e gerenciar ideias de negócios de forma independente e gerar renda.

O programa planeja passo a passo, justifica decisões e desenvolve planos, que documenta. Além de integrar o GPT-4 para geração de texto, o sistema possui acesso à Internet para recuperação de dados, pode armazenar dados e gerar fala por meio da API da Elevenlabs. Supostamente, o sistema é capaz de auto-aperfeiçoamento e correção de bugs, gerando scripts Python via GPT-4.

A demonstração a seguir mostra como o sistema, agindo como um “chefe GPT”, pesquisa autonomamente os próximos eventos, identifica o “Dia da Terra” e gera uma ideia de receita sofisticada apropriada para esse dia.

Do modelo de linguagem ao ajudante diário

A ideia por trás do Auto-GPT e de projetos semelhantes, como o Baby-AGI ou o Jarvis (HuggingGPT), é criar modelos e funções de linguagem de rede para automatizar tarefas complexas. O modelo de linguagem atua como uma espécie de controlador que usa outra linguagem ou modelos e ferramentas especializados de forma automatizada para atingir um determinado objetivo da forma mais autônoma possível.

“Ao alavancar a forte capacidade de linguagem do ChatGPT e os abundantes modelos de IA no Hugging Face, o HuggingGPT é capaz de cobrir inúmeras tarefas sofisticadas de IA em diferentes modalidades e domínios e alcançar resultados impressionantes em linguagem, visão, fala e outras tarefas desafiadoras, o que abre um novo caminho para a inteligência artificial avançada”, escreve a equipe por trás do HuggingGPT.

Modelos de linguagem como plataforma

A ideia de usar modelos de linguagem para ir além da geração de texto puro não é nova: a startup Adept está trabalhando em um sistema de controle de texto universal que permite que um agente de modelo de linguagem pesquise um site, pesquise na Wikipedia ou opere o Excel usando apenas linguagem. A OpenAI introduziu oficialmente um conceito com potencial de automação semelhante a um recurso futuro com os plugins do ChatGPT.

Os primeiros experimentos mostram que os robôs também podem se beneficiar da compreensão da linguagem e do conhecimento mundial de grandes modelos de linguagem. Por exemplo, o Google usa linguagem natural para controlar robôs domésticos que podem combinar a compreensão da linguagem com o ambiente e o reconhecimento de objetos para executar ações em várias etapas sem pré-programação. O exemplo a seguir mostra um robô caseiro simples que pode responder a comandos complexos de linguagem natural com humor graças à conectividade GPT-4.

Usar o auto-prompting para brainstorming também é interessante: dado um tópico, o GPT-4 gera prompts que levam a novos prompts e assim por diante. O software registra os resultados em uma estrutura de mapa mental. O desenvolvedor chama isso de “brainstorming com esteróides absolutos”.