Amazon apresenta seu primeiro trabalho: Agentes de IA avançados
A Amazon, tradicionalmente considerada um pouco atrás na corrida para desenvolver inteligência artificial avançada, criou discretamente um laboratório que já está estabelecendo recordes em desempenho de IA. O AGI SF Lab, localizado em São Francisco e dedicado à construção de inteligência artificial geral – uma IA que supera as capacidades humanas –, revelou os primeiros frutos de seu trabalho: um novo modelo de IA capaz de alimentar alguns dos agentes de inteligência artificial mais avançados disponíveis atualmente.
Denominado Amazon Nova Act, o novo modelo supera os da OpenAI e Anthropic em diversos benchmarks projetados para avaliar a inteligência e aptidão dos agentes de IA, conforme afirma a empresa. Em testes como o GroundUI Web e o ScreenSpot, o Nova Act demonstrou desempenho superior ao do Claude 3.7 Sonnet e do OpenAI Computer Use Agent. Grande parte da estratégia da Amazon para competir no mercado de IA é focada na construção de agentes, e as habilidades do novo modelo refletem seus esforços para desenvolver uma geração de ferramentas que acompanhe os melhores disponíveis.
“Acredito que a unidade atômica básica da computação no futuro será uma chamada para um agente [de IA] gigante”, afirma David Luan, responsável pelo AGI SF Lab. Luan foi anteriormente vice-presidente de engenharia na OpenAI e, posteriormente, cofundador da Adept, uma startup pioneira no desenvolvimento de agentes de IA, antes de se juntar à Amazon em 2024, quando o gigante do comércio eletrônico adquiriu uma participação na empresa.
A maioria dos principais laboratórios de IA atualmente concentra-se na criação de agentes cada vez mais capazes. Fazer com que a IA domine ações independentes, além de manter a conversação, promete tornar a tecnologia mais útil e valiosa. A transição do chat para a ação ainda é um trabalho em andamento. Nos últimos seis meses, a OpenAI, Anthropic, Google e outros demonstraram agentes de navegação na web que executam ações em resposta a comandos. No entanto, esses agentes ainda se mostram, em grande parte, pouco confiáveis e suscetíveis a falhas quando enfrentam solicitações abertas.
Luan explica que o objetivo da Amazon é desenvolver agentes de IA que sejam confiáveis, em vez de apenas impressionantes. O grande desafio não é a necessidade de “mais demonstrações interessantes que funcionem apenas 60% das vezes, e sim o problema tradicional enfrentado por tecnologias que precisam ser treinadas para lidar com casos excepcionais antes de operar de forma autônoma”.
Muitos agentes existentes são construídos combinando grandes modelos de linguagem com múltiplas regras escritas por humanos, que, embora evitem desvios, tornam o comportamento dos agentes mais frágil. O Amazon Nova Act é uma versão do poderoso modelo caseiro Amazon Nova, que passou por um treinamento adicional para auxiliar na tomada de decisões sobre quais ações executar e em que momento. De maneira geral, Luan ressalta que os modelos de IA têm dificuldade em decidir quando devem intervir em uma tarefa.
Para aprimorar as habilidades agenciais do Nova Act, a Amazon utiliza o aprendizado por reforço, um método que ajudou outros modelos de IA a simular melhor o raciocínio. Além disso, a empresa tem se inspirado em robôs físicos para desenvolver seus novos modelos. A equipe de Luan colabora com outro grupo da Amazon, sediado em São Francisco, liderado por Pieter Abbeel – professor da UC Berkeley, que investiga aplicações de IA na robótica. Abbeel, que também integrou a equipe do OpenAI nos primórdios, juntou-se à Amazon em agosto de 2024, após a empresa investir em sua startup, Covariant. Com um grande número de robôs já implantados em seus centros de distribuição, a Amazon encontra um cenário propício para avançar na área de robótica.
A introdução do Amazon Nova Act sugere que a Amazon pode emergir como um competidor forte na corrida para criar agentes de software úteis. Embora tenha demorado a reagir ao ChatGPT, a empresa tem demonstrado sinais de reorganização, como, por exemplo, em fevereiro, quando anunciou uma nova versão da assistente de voz Alexa, com habilidades aprimoradas para conversação e capacidade de automatizar determinadas tarefas na web.
Um dos casos de uso apresentados pela Amazon foi a capacidade da Alexa de auxiliar no agendamento de um serviço de reparo para um forno quebrado. Segundo Luan, as novas capacidades agentivas da Alexa foram desenvolvidas por sua equipe. Além disso, a Amazon já realizou pesquisas sobre como agentes podem, futuramente, melhorar o comércio eletrônico, automatizando o processo de encontrar e adquirir produtos, com funcionalidades como a adição automática de itens no carrinho de compras com base nos interesses e hábitos dos usuários.
Além de apresentar o novo modelo, a Amazon anunciou a criação de um kit de desenvolvimento de software (SDK) que facilita para os engenheiros de computação o uso do Amazon Nova Act na construção de agentes de software. O SDK permite que os desenvolvedores forneçam instruções específicas aos agentes para auxiliá-los a navegar em uma internet desenhada para usuários humanos. Por exemplo, um agente pode ser orientado a “não aceitar a oferta adicional de seguro” ao reservar um carro alugado.
Em última análise, Luan afirma que os agentes da Amazon devem se tornar inteligentes o suficiente para não se deixarem enganar por ofertas adicionais de forma autônoma. “O Nova Act é realmente como o primeiro passo nessa visão”, conclui.