Herramientas, Inteligencia Artificial

El Agente-1 puede «manejar software como un humano»

Atualizado em 29/08/2023

Únete a la comunidad

Únete a nuestra lista y recibe contenido exclusivo.

El Agente-1 pronto podrá manejar cualquier software. Inicialmente, el modelo de IA se lanzará como parte de una extensión del navegador.

Matt Shumer, CEO de HyperWriteAI y OthersideAI, ha anunciado un modelo básico llamado «Agente-1». Supuestamente, puede manejar software como un humano. Aún no hay ningún artículo científico disponible, pero ha demostrado sus capacidades en un vídeo.

Según Shumer, los modelos actuales de IA, como el GPT-4, e incluso los modelos de próxima generación que aún no han salido al mercado, no son capaces de manejar software e interfaces de programación de forma fiable.

Introducing `Agent-1`: a breakthrough foundation model that can operate software like a human.

This is the brain powering Personal Assistant.

We’re already well above previous state-of-the-art, and we’re improving massively each week.

More details: pic.twitter.com/WTg4Ft6dQZ
— Matt Shumer (@mattshumer_) August 2, 2023

El coste y la velocidad también son cuestiones importantes debido a la complejidad de las operaciones de software, afirma. «Agent-1» pretende resolver este problema. Shumer promete mucho: «Ya estamos muy por delante del estado de la técnica anterior y mejoramos espectacularmente cada semana».

Integración en plugins de Chrome

Se espera que el Agente-1 se integre en el Asistente Personal de HyperWrite en las próximas actualizaciones. Se trata de una extensión para el navegador que proporciona un generador de texto de IA independiente del sitio web.

A finales de junio, Shumer presentó una versión muy temprana del Asistente Personal, que puede realizar tareas sencillas en el navegador, como enviar un correo electrónico o pedir comida.

Sin embargo, el Agente-1 podría encargarse de tareas mucho más complejas. En el vídeo de demostración de Shumer se puede ver al Agente-1 controlando un panel de control de Google Cloud.

Pensamiento dinámico

«Los modelos actuales almacenan muchos conocimientos, dejando menos parámetros para el razonamiento», explica. «En cambio, nuestro objetivo es poner toda la potencia del modelo al servicio del razonamiento dinámico»

Este enfoque de «razonamiento dinámico», dice, permite al modelo enfrentarse a situaciones para las que no ha sido entrenado. Shumer ha puesto el listón muy alto para el Agente-1:

Nuestro objetivo es superar la capacidad humana: un asistente que pueda manejar cualquier software y cumplir objetivos complejos de forma fiable en nombre del usuario».
Matt Shumer, CEO de HyperWrite

Como ocurre con cualquier agente de IA, es de esperar que surjan problemas, pero Shumer promete que el Agente-1 mejorará con el tiempo, aprendiendo sobre la marcha. En las próximas semanas averiguaremos si el Agente-1 cumple las promesas de Shumer; aparte del breve vídeo, no hay más información que respalde sus afirmaciones.

Por cierto, ¿qué era ACT-1?

Agent-1 se parece mucho a la demo ACT-1 de Adept. No se ha sabido mucho de esta startup estadounidense desde su anuncio en septiembre de 2022, salvo una ronda de financiación de serie B de 350 millones de dólares que se completó en marzo. Entre sus fundadores se encuentran antiguos investigadores de Deepmind, Meta y Google, uno de los cuales fue el autor de la arquitectura Transformer, que ahora sirve de base para modelos como GPT-4.

Recientemente, la Universidad de Berkeley y Microsoft Research también presentaron Gorilla, un gran modelo lingüístico que ha sido entrenado en 1.600 interfaces de programación y es capaz de manejar software.

André Lug

Soy el fundador de Iglu Online y escritor del blog André Lug. Como experto en gestión de proyectos y marketing digital, comparto contenido sobre productividad, emprendimiento, análisis y resúmenes de libros.

El Agente-1 puede «manejar software como un humano»

Únete a nuestra lista y recibe contenido exclusivo.

Integración en plugins de Chrome

Pensamiento dinámico

Por cierto, ¿qué era ACT-1?

André Lug

Deja una respuesta Cancelar la respuesta

Inscreva-se em nossa newsletter

¿Por dónde andamos?