OpenAI expande sua plataforma para desenvolvedores com novas APIs e ferramentas voltadas para a criação de sistemas autônomos de IA mais avançados.
A nova API de Respostas reúne recursos das APIs de Chat Completions e Assistants, oferecendo aos desenvolvedores uma base mais flexível para construir aplicações de agentes com integração para busca na web, manipulação de arquivos e controle computacional.
A ferramenta integrada de busca na web utiliza os modelos GPT-4o e GPT-4o-mini, alcançando 90% e 88% de precisão, respectivamente, no benchmark de consultas factuais SimpleQA. Assim como acontece com o ChatGPT, as respostas vêm acompanhadas de links para artigos de notícias e posts de blogs, embora isso não garanta a exatidão das informações. Os desenvolvedores podem acessar esse recurso por US$30 ou US$25 por mil consultas.
Para equipes que trabalham com grandes coleções de documentos, a nova ferramenta de busca em arquivos foi criada para facilitar a localização de informações específicas. Seu custo é de US$2,50 por mil buscas, além de custos de armazenamento de US$0,10 por gigabyte por dia.
Um dos recursos mais ambiciosos é a ferramenta que permite que agentes de IA controlem computadores, baseada na mesma tecnologia utilizada pelo agente “Operator” da OpenAI. Embora promissor, esse agente computacional ainda apresenta limitações, com uma taxa de sucesso de apenas 38,1% em tarefas complexas, o que reforça a necessidade de supervisão humana.
O controle computacional tem um custo de US$3 por milhão de tokens de entrada e US$12 por milhão de tokens de saída, com acesso limitado, durante a fase de pré-visualização, a desenvolvedores selecionados. Para auxiliar as equipes na monitoração das ações dos agentes, a OpenAI também disponibiliza um sistema de acompanhamento de fluxos de trabalho.
Conteúdos de mídia externa, como vídeos do YouTube, podem ser bloqueados e, ao serem carregados ou reproduzidos, estabelecem conexões com os servidores dos respectivos provedores, podendo ocorrer a transmissão de dados pessoais durante esse processo.
Além disso, os desenvolvedores podem armazenar dados diretamente na plataforma da OpenAI para avaliar o desempenho dos agentes por meio de rastreamento e análises. Importante destacar que dados empresariais e dos usuários não serão usados para treinar os modelos por padrão.
A nova SDK de Agentes de código aberto simplifica o gerenciamento de fluxos de trabalho envolvendo múltiplos agentes, oferecendo modelos de linguagem configuráveis, transferências entre agentes, controles de segurança integrados e ferramentas analíticas. Atualmente disponível para Python, com suporte para Node.js a caminho, a SDK funciona tanto com as APIs da OpenAI quanto com os modelos de outros provedores que adotam o padrão Chat Completions.
Olhando para o futuro, a OpenAI planeja descontinuar gradualmente a API de Assistants em favor da nova API de Respostas até meados de 2026, quando se alcançar a paridade de funcionalidades. Enquanto a API de Chat Completions continuará a receber atualizações para desenvolvedores que não necessitam das ferramentas integradas, a empresa recomenda migrar para a API de Respostas devido às suas capacidades ampliadas.
Resumo
- A OpenAI introduziu novas interfaces e ferramentas que simplificam o desenvolvimento de agentes autônomos, com a API de Respostas como destaque, combinando funções anteriores e oferecendo maior flexibilidade.
- Foram lançadas ferramentas integradas para casos específicos: uma busca na web com alta precisão em consultas factuais, uma busca de arquivos para localizar informações em grandes conjuntos de dados e uma ferramenta para controle computacional, que exige supervisão humana devido à sua confiabilidade ainda limitada.
- A empresa também disponibilizou uma SDK de Agentes de código aberto para ajudar desenvolvedores a coordenar, de maneira segura e eficiente, fluxos de trabalho complexos entre múltiplos agentes de IA.