Humpback de Meta: empujando los límites de los LLM de código abierto a través de autoalineación
Meta ha desarrollado un método para que los modelos de lenguaje grandes mejoren iterativamente su capacidad para seguir instrucciones, sin depender de anotaciones humanas costosas