Em breve, o Agente-1 poderá operar qualquer software. Inicialmente, o modelo de IA será lançado como parte de uma extensão de navegador.
Matt Shumer, CEO da HyperWriteAI e OthersideAI, anunciou um modelo básico chamado “Agente-1”. Supostamente, ele pode operar software como um humano. Ainda não há um artigo científico disponível, mas ele demonstrou as capacidades em um vídeo.
Segundo Shumer, os modelos de IA atuais, como o GPT-4, e até mesmo os modelos de próxima geração que ainda não foram lançados, não são capazes de operar software e interfaces de programação de forma confiável.
Introducing `Agent-1`: a breakthrough foundation model that can operate software like a human.
— Matt Shumer (@mattshumer_) August 2, 2023
This is the brain powering Personal Assistant.
We’re already well above previous state-of-the-art, and we’re improving massively each week.
More details: pic.twitter.com/WTg4Ft6dQZ
Custo e velocidade também são questões importantes devido à complexidade das operações de software, disse ele. “Agente-1” tem como objetivo resolver esse problema. Shumer promete muito: “Já estamos muito acima do estado-da-arte anterior e estamos melhorando drasticamente a cada semana”.
Integração do plugin para Chrome
Espera-se que o Agente-1 seja integrado ao Assistente Pessoal da HyperWrite nas próximas atualizações. Trata-se de uma extensão para navegadores que fornece um gerador de texto de IA independente de sites.

No final de junho, Shumer apresentou uma versão muito inicial do Assistente Pessoal, que pode realizar tarefas simples no navegador, como enviar um e-mail ou fazer um pedido de comida.
No entanto, o Agente-1 poderia assumir tarefas muito mais complexas. No vídeo de demonstração de Shumer, é possível ver o Agente-1 controlando um painel do Google Cloud.

Pensamento dinâmico
“Os modelos atuais armazenam muitos conhecimentos, deixando menos parâmetros para o raciocínio”, explica ele. “Em vez disso, nosso objetivo é colocar toda a potência do modelo para trabalhar no raciocínio dinâmico.”
Essa abordagem de “raciocínio dinâmico”, segundo ele, permite que o modelo lide com situações para as quais não foi treinado. Shumer estabeleceu um alto padrão para o Agente-1:
Nosso objetivo é superar a capacidade humana – um assistente que pode operar qualquer software e realizar de forma confiável metas complexas em nome do usuário.
Matt Shumer, CEO da HyperWrite
Como acontece com qualquer agente de IA, é de se esperar que ocorram problemas, mas Shumer promete que o Agente-1 melhorará com o tempo, aprendendo conforme avança. Nas próximas semanas, saberemos se o Agente-1 corresponde às promessas de Shumer – além do breve vídeo, não há outras informações para respaldar suas afirmações.
A propósito, o que era o ACT-1 novamente?
O Agente-1 se assemelha muito à demonstração do ACT-1 da Adept. A startup dos EUA não tem sido muito ouvida desde o anúncio em setembro de 2022, exceto por uma rodada de financiamento da Série B de US$ 350 milhões que foi concluída em março. Seus fundadores incluem ex-pesquisadores da Deepmind, Meta e Google, um dos quais foi autor da arquitetura Transformer, que agora serve de base para modelos como o GPT-4.
Recentemente, a Universidade de Berkeley e a Microsoft Research também apresentaram o Gorilla, um grande modelo de linguagem que foi treinado em 1.600 interfaces de programação e é capaz de operar software.