No final de março, a OpenAI anunciou sua intenção de lançar seu primeiro modelo de linguagem “aberto” desde o GPT‑2, em algum momento deste ano. Agora, detalhes sobre esse modelo começam a surgir a partir das sessões da empresa com a comunidade de desenvolvedores de IA.

Fontes afirmam que Aidan Clark, vice‑presidente de pesquisa da OpenAI, está à frente do desenvolvimento do modelo, que ainda se encontra em estágios iniciais. A empresa tem como meta um lançamento no início do verão, buscando fazer do novo modelo — um modelo de raciocínio semelhante aos modelos da série o — o melhor entre os modelos abertos de raciocínio disponíveis.

A OpenAI está explorando uma licença altamente permissiva para esse modelo, com poucas restrições de uso ou comerciais. Modelos abertos como o Llama e o Gemma têm sido alvo de críticas na comunidade por impor exigências rigorosas — críticas que a OpenAI aparentemente deseja evitar.

A pressão aumenta com a concorrência de laboratórios de IA, como o DeepSeek chinês, que adotam uma abordagem aberta na disponibilização de modelos. Diferente da estratégia tradicional da OpenAI, esses concorrentes “abertos” liberam seus modelos para que a comunidade de IA possa experimentá-los e, em alguns casos, comercializá-los.

Essa estratégia tem se mostrado extremamente bem‑sucedida para alguns grupos. A Meta, que investiu pesadamente em sua família de modelos abertos Llama, afirmou recentemente que o Llama ultrapassou 1 bilhão de downloads; enquanto isso, o DeepSeek rapidamente conquistou uma ampla base de usuários global e atraiu a atenção de investidores do país.

Segundo fontes, a OpenAI pretende que seu modelo aberto, baseado em “texto de entrada e texto de saída”, seja executado em hardware de ponta para consumidores e, possivelmente, permita que os desenvolvedores alternem a funcionalidade de “raciocínio” — recurso semelhante aos dos modelos lançados recentemente por outras empresas. (Embora o raciocínio possa aumentar a precisão, ele também eleva a latência.) Caso o lançamento seja bem recebido, a OpenAI pode expandir a linha com modelos adicionais — potencialmente incluindo modelos de menor porte.

Em declarações anteriores, o CEO da OpenAI, Sam Altman, afirmou acreditar que a empresa tem se posicionado ao lado “errado da história” no que diz respeito ao lançamento de tecnologias como código aberto.

Pessoalmente, acho que precisamos descobrir uma estratégia de código aberto diferente”, disse Altman durante uma sessão de perguntas e respostas no Reddit em janeiro. “Nem todos na OpenAI compartilham essa visão, e esse também não é, no momento, nossa maior prioridade […] Produziremos modelos melhores daqui para frente, mas manteremos uma vantagem menor do que a que tínhamos em anos anteriores.”

Altman também comentou que o novo modelo passará por um rigoroso processo de “red teaming” e será avaliado minuciosamente quanto à segurança. Fontes afirmam que a OpenAI planeja liberar um relatório técnico detalhado — um documento completo que apresentará os resultados dos testes internos e externos de benchmarking e de segurança realizados no modelo.

“Antes do lançamento, avaliaremos este modelo de acordo com nosso framework de preparação, como faríamos com qualquer outro modelo”, declarou Altman em uma publicação recente. “E efetuaremos trabalhos adicionais, considerando que sabemos que este modelo sofrerá modificações após o lançamento.”

A OpenAI já enfrentou críticas de especialistas em ética de IA por, supostamente, ter acelerado os testes de segurança de modelos recentes e por não ter divulgado relatórios técnicos para alguns deles. Sam Altman também foi acusado de ter enganado executivos da empresa sobre as revisões de segurança dos modelos antes de sua breve saída em novembro de 2023.