O GPT 4.5 é “a prova de que podemos continuar o paradigma de escalabilidade”, diz Diretor de Pesquisa da OpenAI
A OpenAI apresentou seu maior modelo de linguagem até hoje. Segundo Mark Chen, Diretor de Pesquisa da empresa, o GPT 4.5 demonstra que a escalabilidade dos modelos de IA ainda não atingiu seus limites.
A empresa anunciou seu mais recente modelo de linguagem, GPT 4.5, nesta quinta-feira, descrevendo-o como seu maior e mais capaz modelo de chat até o momento. Inicialmente, ele será disponibilizado para usuários Pro, seguido por usuários Plus, Enterprise, Team e Edu, nas próximas semanas.
Para Chen, o GPT 4.5 serve como resposta aos críticos que questionam se os laboratórios de pesquisa conseguirão continuar avançando por meio da construção de modelos cada vez maiores. “O GPT 4.5 é realmente a prova de que podemos continuar o paradigma de escalabilidade”, explicou. “Este é o ponto que representa a próxima ordem de magnitude.”
Quando questionado sobre o motivo de o novo modelo não ter sido nomeado como GPT-5, Chen esclareceu que a OpenAI busca seguir padrões reconhecíveis na nomenclatura. Com uma escalabilidade previsível – como na transição do GPT-3 para o 3.5 – é possível projetar quais melhorias surgirão com um aumento considerável no poder computacional e ganhos de eficiência. Assim, o novo modelo corresponde exatamente ao que se esperava de um GPT 4.5.
Dois caminhos paralelos: pré-treinamento e raciocínio
Chen enfatizou que a OpenAI agora consegue escalar em dois eixos distintos. “O GPT 4.5 é nosso mais recente experimento de escalabilidade no eixo do aprendizado não supervisionado, mas também incorporamos o raciocínio”, destacou. Segundo ele, o tempo de desenvolvimento mais longo entre o GPT-4 e o 4.5 deve-se ao forte foco da empresa em aprimorar o paradigma do raciocínio.
Essas duas abordagens se complementam: “É necessário ter conhecimento para construir o raciocínio sobre ele. Um modelo não pode simplesmente aprender a raciocinar do zero”, afirmou Chen. Os dois paradigmas se reforçam e criam ciclos de feedback.
Chen também observou que o GPT 4.5 é “inteligente” de uma maneira diferente dos modelos focados exclusivamente em raciocínio. Ele possui significativamente mais conhecimento sobre o mundo. Em comparações com o GPT-4o, os usuários mostraram preferência pelo novo modelo em 60% dos casos para situações do dia a dia. Para tarefas de produtividade e trabalho baseado em conhecimento, essa preferência chega a quase 70%.
O desenvolvimento do GPT-4.5 segue padrões esperados
Ao ser questionado sobre possíveis limites à escalabilidade, Chen foi claro: “Observamos os mesmos resultados. O GPT 4.5 é o próximo passo nesse paradigma do aprendizado não supervisionado.” Ele explicou que a OpenAI adota uma abordagem rigorosa, criando projeções baseadas em todos os modelos treinados anteriormente para determinar o desempenho esperado.
Além dos benchmarks tradicionais – onde o GPT 4.5 demonstra melhorias semelhantes ao salto do GPT-3.5 para o GPT-4 – Chen afirmou que o modelo traz novas capacidades. Ele citou, por exemplo, a habilidade de criar arte em ASCII, uma tarefa na qual os modelos anteriores geralmente falhavam.
Chen também descartou relatos de que o desenvolvimento do GPT 4.5 tenha sido especialmente difícil. “O desenvolvimento de todos os nossos modelos fundamentais é experimental. Muitas vezes, isso implica interromper o processo em determinados pontos, analisar o que está acontecendo e depois reiniciar os treinamentos”, explicou. Essa abordagem foi adotada tanto para o GPT 4.5 quanto para o GPT-4 e a série de modelos O.
É interessante notar que o modelo significativamente menor, Claude 3.7 Sonnet, supera o GPT-4.5 da Anthropic em diversas áreas, além de aparentar estar relativamente desatualizado, com um corte de conhecimento datado de outubro de 2023. Uma das possíveis razões para isso reside nos dados de treinamento, pois muitos avanços foram alcançados no campo dos dados sintéticos desde 2023.