El framework «Árbol de Pensamientos» combina la búsqueda en árbol con el GPT-4 para mejorar drásticamente las capacidades de resolución de problemas del modelo de lenguaje.
«Árbol de Pensamientos» es un nuevo framework desarrollado por investigadores de la Universidad de Princeton y Google DeepMind para inferir modelos de lenguaje como el GPT-4, inspirado en métodos de ingeniería de prompts como la Cadeia de Pensamiento. Sin embargo, a diferencia de estos métodos, el ToT no se basa únicamente en prompts, sino que utiliza un módulo externo para utilizar unidades de texto, que el equipo llama «pensamientos», como pasos intermedios para resolver problemas.
El framework «Árbol de Pensamientos» toma elementos de estrategias de prompts familiares, pero es un framework completo. | Imagen: Yao et al.
Según el equipo, el ToT permite que el GPT-4 tome decisiones «considerando múltiples caminos de razonamiento diferentes y evaluando sus elecciones para decidir el siguiente curso de acción, además de mirar hacia adelante o retroceder cuando sea necesario para tomar decisiones globales».
En los experimentos, el equipo demuestra que el framework ToT mejora significativamente la capacidad del GPT-4 para resolver problemas, a veces de manera drástica. Por ejemplo, mientras que el GPT-4 solo puede resolver el 4% de las tareas del «Juego del 24» con la estrategia de prompts de la Cadeia de Pensamiento, el modelo de lenguaje con ToT logra una tasa de éxito del 74%. El ToT también mejora significativamente el rendimiento del GPT-4 en crucigramas y tareas de escritura creativa.
GPT-4 y AlphaZero se unen
De esta manera, el ToT mejora las capacidades rudimentarias de razonamiento de grandes modelos de lenguaje, como el GPT-4, con heurísticas de búsqueda similares a las utilizadas en sistemas de IA, como AlphaZero. A diferencia del sistema de IA de DeepMind, el ToT no aprende, sino que implementa la heurística de búsqueda a través de la autoevaluación y la deliberación del GPT-4. Según el equipo, el ToT también se inspira en la distinción entre el Sistema 1 y el Sistema 2 de Daniel Kahneman.
El framework Árbol de Pensamientos ofrece una manera de traducir ideas clásicas sobre la resolución de problemas en métodos aplicables para los modelos de lenguaje contemporáneos (LM). Al mismo tiempo, los LMs abordan una debilidad de estos métodos clásicos, proporcionando una forma de resolver problemas complejos que no se pueden formalizar fácilmente, como la escritura creativa.
Yao et al.
En otro artículo preliminar, un investigador de Theta Labs también presenta un método llamado «Árbol de Pensamientos» y mejoras significativas en los rompecabezas Sudoku. El autor menciona las técnicas de autojuego conocidas de AlphaZero como una dirección de investigación interesante. Un método similar podría permitir que el sistema ToT desarrolle estrategias innovadoras para resolver problemas que no están presentes en el corpus de texto utilizado para entrenar los modelos de lenguaje.