O framework “Árvore de Pensamentos” combina a busca em árvore com o GPT-4 para melhorar drasticamente as capacidades de resolução de problemas do modelo de linguagem.
“Árvore de Pensamentos” é um novo framework desenvolvido por pesquisadores da Universidade de Princeton e do Google DeepMind para inferir modelos de linguagem como o GPT-4, inspirado em métodos de engenharia de prompts como a Cadeia de Pensamento. No entanto, diferentemente desses métodos, o ToT não se baseia apenas em prompts, mas utiliza um módulo externo para usar unidades de texto, que a equipe chama de “pensamentos”, como etapas intermediárias para resolver problemas.
De acordo com a equipe, o ToT permite que o GPT-4 tome decisões “considerando múltiplos caminhos de raciocínio diferentes e avaliando suas escolhas para decidir o próximo curso de ação, além de olhar para frente ou retroceder quando necessário para tomar decisões globais”.
Nos experimentos, a equipe demonstra que o framework ToT melhora significativamente a capacidade do GPT-4 de resolver problemas, às vezes de forma drástica. Por exemplo, enquanto o GPT-4 é capaz de resolver apenas 4% das tarefas do “Jogo do 24” com a estratégia de prompts da Cadeia de Pensamento, o modelo de linguagem com ToT alcança uma taxa de sucesso de 74%. O ToT também melhora significativamente o desempenho do GPT-4 em palavras cruzadas e tarefas de escrita criativa.
GPT-4 e AlphaZero se unem
Dessa forma, o ToT aprimora as capacidades rudimentares de raciocínio de grandes modelos de linguagem, como o GPT-4, com heurísticas de busca semelhantes às utilizadas em sistemas de IA, como o AlphaZero. Ao contrário do sistema de IA da DeepMind, o ToT não aprende, mas implementa a heurística de busca por meio da autoavaliação e deliberação do GPT-4. De acordo com a equipe, o ToT também é inspirado na distinção entre Sistema 1 e Sistema 2 de Daniel Kahneman.
O framework Árvore de Pensamentos oferece uma maneira de traduzir insights clássicos sobre resolução de problemas em métodos aplicáveis para LMs (modelos de linguagem) contemporâneos. Ao mesmo tempo, os LMs abordam uma fraqueza desses métodos clássicos, fornecendo uma maneira de resolver problemas complexos que não são facilmente formalizados, como a escrita criativa.
Yao et al.
Em outro artigo preliminar, um pesquisador da Theta Labs também apresenta um método chamado “Árvore de Pensamentos” e melhorias significativas em quebra-cabeças Sudoku. O autor cita as técnicas de autojogo conhecidas do AlphaZero como uma direção de pesquisa interessante. Um método semelhante poderia permitir que o sistema ToT desenvolvesse estratégias inovadoras de resolução de problemas que não estão presentes no corpus de texto de treinamento dos modelos de linguagem.