Em breve, o Agente-1 poderá operar qualquer software. Inicialmente, o modelo de IA será lançado como parte de uma extensão de navegador.

Matt Shumer, CEO da HyperWriteAI e OthersideAI, anunciou um modelo básico chamado “Agente-1”. Supostamente, ele pode operar software como um humano. Ainda não há um artigo científico disponível, mas ele demonstrou as capacidades em um vídeo.

Segundo Shumer, os modelos de IA atuais, como o GPT-4, e até mesmo os modelos de próxima geração que ainda não foram lançados, não são capazes de operar software e interfaces de programação de forma confiável.

Custo e velocidade também são questões importantes devido à complexidade das operações de software, disse ele. “Agente-1” tem como objetivo resolver esse problema. Shumer promete muito: “Já estamos muito acima do estado-da-arte anterior e estamos melhorando drasticamente a cada semana”.

Integração do plugin para Chrome

Espera-se que o Agente-1 seja integrado ao Assistente Pessoal da HyperWrite nas próximas atualizações. Trata-se de uma extensão para navegadores que fornece um gerador de texto de IA independente de sites.

agent-1

No final de junho, Shumer apresentou uma versão muito inicial do Assistente Pessoal, que pode realizar tarefas simples no navegador, como enviar um e-mail ou fazer um pedido de comida.

No entanto, o Agente-1 poderia assumir tarefas muito mais complexas. No vídeo de demonstração de Shumer, é possível ver o Agente-1 controlando um painel do Google Cloud.

como funciona o agent-1

Pensamento dinâmico

“Os modelos atuais armazenam muitos conhecimentos, deixando menos parâmetros para o raciocínio”, explica ele. “Em vez disso, nosso objetivo é colocar toda a potência do modelo para trabalhar no raciocínio dinâmico.”

Essa abordagem de “raciocínio dinâmico”, segundo ele, permite que o modelo lide com situações para as quais não foi treinado. Shumer estabeleceu um alto padrão para o Agente-1:

Nosso objetivo é superar a capacidade humana – um assistente que pode operar qualquer software e realizar de forma confiável metas complexas em nome do usuário.

Matt Shumer, CEO da HyperWrite

Como acontece com qualquer agente de IA, é de se esperar que ocorram problemas, mas Shumer promete que o Agente-1 melhorará com o tempo, aprendendo conforme avança. Nas próximas semanas, saberemos se o Agente-1 corresponde às promessas de Shumer – além do breve vídeo, não há outras informações para respaldar suas afirmações.

A propósito, o que era o ACT-1 novamente?

O Agente-1 se assemelha muito à demonstração do ACT-1 da Adept. A startup dos EUA não tem sido muito ouvida desde o anúncio em setembro de 2022, exceto por uma rodada de financiamento da Série B de US$ 350 milhões que foi concluída em março. Seus fundadores incluem ex-pesquisadores da Deepmind, Meta e Google, um dos quais foi autor da arquitetura Transformer, que agora serve de base para modelos como o GPT-4.

Recentemente, a Universidade de Berkeley e a Microsoft Research também apresentaram o Gorilla, um grande modelo de linguagem que foi treinado em 1.600 interfaces de programação e é capaz de operar software.