Humpback da Meta: empurrando os limites dos LLMs de código aberto através de autoalinhamento
O Meta desenvolveu um método para que modelos de linguagem grandes melhorem iterativamente sua capacidade de seguir instruções, sem depender de anotações humanas caras ou