A OpenAI anunciou a disponibilidade geral do GPT-4, seu mais recente modelo gerador de texto, por meio de sua API.

A partir desta tarde, todos os desenvolvedores existentes da API da OpenAI “com histórico de pagamentos bem-sucedidos” podem acessar o GPT-4. A empresa planeja abrir o acesso a novos desenvolvedores até o final deste mês e, em seguida, começar a aumentar os limites de disponibilidade após isso, “dependendo da disponibilidade de computação”.

“Milhões de desenvolvedores solicitaram acesso à API do GPT-4 desde março, e a variedade de produtos inovadores aproveitando o GPT-4 está crescendo a cada dia”, escreveu a OpenAI em um post no blog. “Visualizamos um futuro em que modelos baseados em chat possam suportar qualquer caso de uso”.

O GPT-4 pode gerar texto (incluindo código) e aceitar imagens e entradas de texto – uma melhoria em relação ao GPT-3.5, seu antecessor, que só aceitava texto – e tem desempenho “em nível humano” em várias referências profissionais e acadêmicas. Como os modelos GPT anteriores da OpenAI, o GPT-4 foi treinado usando dados publicamente disponíveis, incluindo de páginas da web públicas, bem como dados licenciados pela OpenAI.

A capacidade de compreensão de imagens ainda não está disponível para todos os clientes da OpenAI. A OpenAI está testando-a com um único parceiro, o Be My Eyes, para começar. Mas ela não indicou quando a abrirá para a base de clientes mais ampla.

Vale ressaltar que, assim como acontece com os melhores modelos de IA generativa hoje, o GPT-4 não é perfeito. Ele “alucina” fatos e comete erros de raciocínio, às vezes com confiança. E ele não aprende com sua experiência, falhando em problemas difíceis, como introduzir vulnerabilidades de segurança no código que gera.

No futuro, a OpenAI diz que permitirá que os desenvolvedores ajustem o GPT-4 e o GPT-3.5 Turbo, um de seus outros modelos geradores de texto recentes, mas menos capaz (e um dos modelos originais que alimentam o ChatGPT), com seus próprios dados, assim como já era possível com vários outros modelos geradores de texto da OpenAI. Essa capacidade deve chegar ainda este ano, de acordo com a OpenAI.

Desde a revelação do GPT-4 em março, a competição de IA generativa ficou mais acirrada. Recentemente, a Anthropic expandiu a janela de contexto para o Claude – seu principal modelo de IA gerador de texto, ainda em prévia – de 9.000 tokens para 100.000 tokens. (A janela de contexto refere-se ao texto que o modelo considera antes de gerar texto adicional, enquanto os tokens representam o texto bruto – por exemplo, a palavra “fantástico” seria dividida nos tokens “fan”, “tas” e “tic”.)

O GPT-4 detinha o recorde anterior em termos de janela de contexto, com um máximo de 32.000 tokens. Em geral, os modelos com janelas de contexto pequenas tendem a “esquecer” o conteúdo de conversas recentes, levando-os a se desviar do assunto.

Em um anúncio relacionado hoje, a OpenAI informou que está disponibilizando de forma geral suas APIs DALL-E 2 e Whisper – sendo o DALL-E 2 o modelo de geração de imagens da OpenAI e “Whisper” referindo-se ao modelo de fala para texto da empresa. A empresa também afirmou que planeja descontinuar os modelos antigos disponíveis por meio de sua API para “otimizar sua capacidade computacional”. (Nos últimos meses, em grande parte devido à crescente popularidade do ChatGPT, a OpenAI tem lutado para atender à demanda por seus modelos generativos.)

A partir de 4 de janeiro de 2024, certos modelos mais antigos da OpenAI – especificamente o GPT-3 e suas derivações – não estarão mais disponíveis e serão substituídos por novos modelos “base GPT-3” que se presume sejam mais eficientes em termos de processamento. Os desenvolvedores que usam os modelos antigos terão que atualizar manualmente suas integrações até 4 de janeiro, e aqueles que desejam continuar usando os modelos antigos ajustados além dessa data terão que ajustar substituições com base nos novos modelos base GPT-3.

“Forneceremos suporte aos usuários que ajustaram modelos anteriormente para tornar essa transição o mais tranquila possível”, escreveu a OpenAI. “Nas próximas semanas, entraremos em contato com os desenvolvedores que usaram recentemente esses modelos antigos e forneceremos mais informações assim que os novos modelos de conclusão estiverem prontos para testes iniciais.” Com conteúdo do TechCrunch.