Atualização 1 de abril de 2025

A Amazon divulgou novos exemplos demonstrando as capacidades do Nova Act, afirmando que o sistema opera de forma mais confiável do que as soluções existentes. De acordo com a empresa, o sistema decompõe fluxos de trabalho complexos em comandos discretos – tais como realizar buscas, efetuar pagamentos ou responder a perguntas sobre o conteúdo exibido na tela – permitindo que os desenvolvedores adicionem instruções personalizadas, chamem APIs e interajam diretamente com os navegadores por meio da biblioteca Playwright.

Em testes internos, a Amazon relatou que o Nova Act alcançou taxas de sucesso superiores a 90% em interações na interface, como a seleção de datas e o gerenciamento de pop-ups. O sistema superou modelos comparáveis desenvolvidos pela Anthropic e OpenAI em benchmarks estabelecidos como ScreenSpot e GroundUI Web.

nova act benchmarks

A Amazon afirma que o Nova Act funciona de forma eficaz mesmo em ambientes completamente inéditos – como jogos de navegador –, mesmo não tendo sido treinado especificamente para essas situações. A empresa já integrou o modelo ao seu assistente de voz, o Alexa+.

A Amazon enxerga o Nova Act como o primeiro passo rumo a agentes de inteligência artificial mais sofisticados. Ao invés de depender exclusivamente do ajuste fino supervisionado, a empresa planeja enfatizar o aprendizado por reforço em diversos ambientes – uma abordagem semelhante à utilizada no Computer-Using Agent (CUA) da OpenAI, que também empregou aprendizado por reforço com dados da web para treinamento.

A visão de longo prazo da Amazon envolve a criação de agentes de IA capazes de executar tarefas em múltiplas etapas, como o planejamento de casamentos ou operações complexas de TI, de forma autônoma. Em uma demonstração, o Nova Act foi mostrado configurando uma mensagem de ausência no Outlook.

Atualmente, esses agentes exigem supervisão humana significativa. O objetivo das empresas que desenvolvem esses sistemas é tornar os processos mais confiáveis, rápidos e capazes de operar em paralelo, gerenciando diversas tarefas de escritório automaticamente.

Artigo original de 31 de março de 2025

A Amazon lançou o Nova Act, um novo sistema de desenvolvimento de agentes de inteligência artificial, juntamente com um serviço web para acessar seus modelos de IA já existentes.

Desenvolvedores e clientes nos Estados Unidos já podem acessar a versão de pré-visualização do Nova Act SDK, que oferece acesso aos modelos de linguagem da Amazon – Nova Micro, Lite e Pro – assim como a modelos para geração de imagens (Nova Canvas) e criação de vídeos (Nova Reel). Embora esses modelos já estejam disponíveis por meio do Amazon Bedrock, o novo site nova.amazon.com foi criado para torná-los ainda mais acessíveis.

Segundo um executivo da Amazon, “nova.amazon.com coloca o poder da inteligência de ponta da empresa nas mãos de cada desenvolvedor e entusiasta de tecnologia, facilitando a exploração das capacidades do Amazon Nova”.

O Nova Act SDK possibilita que os desenvolvedores construam agentes de IA capazes de navegar em ambientes de internet e realizar diversas ações, de forma semelhante ao Operator da OpenAI. Conforme a empresa, o Nova Act auxilia na decomposição de processos complexos em comandos gerenciáveis para ações como buscas na web, processamento de pagamentos e resposta a perguntas. A plataforma também conta com recursos para a adição de instruções detalhadas que aprimoram a confiabilidade dos processos.

Em uma demonstração, um vídeo mostrou o Nova Act em ação. A Amazon ressalta que os agentes são sistemas que podem executar tarefas e atuar em uma variedade de ambientes digitais e físicos em nome do usuário, ainda que estejam em estágio inicial.

O lançamento do Nova Act representa a entrada da Amazon no crescente campo dos agentes de inteligência artificial, capazes de realizar tarefas em ambientes digitais. Especialistas do setor apontam essa tecnologia como uma possível nova fronteira de crescimento para a IA, com implicações na automação de diversas atividades administrativas e na execução de tarefas a velocidades superiores às capacidades humanas.