Intelligence artificielle, Outils

L’agent 1 peut « utiliser le logiciel comme un humain »

Atualizado em 29/08/2023

Faites partie de la communauté

Rejoignez notre liste de diffusion et recevez du contenu exclusif

L’agent-1 sera bientôt capable de faire fonctionner n’importe quel logiciel. Dans un premier temps, le modèle d’IA sera publié dans le cadre d’une extension de navigateur.

Matt Shumer, PDG de HyperWriteAI et OthersideAI, a annoncé un modèle de base appelé « Agent-1 ». Il est supposé pouvoir utiliser un logiciel comme un humain. Il n’y a pas encore d’article scientifique disponible, mais il en a fait la démonstration dans une vidéo.

Selon M. Shumer, les modèles d’IA actuels, tels que le GPT-4, et même les modèles de la prochaine génération qui n’ont pas encore été lancés, ne sont pas capables d’utiliser des logiciels et des interfaces de programmation de manière fiable.

Introducing `Agent-1`: a breakthrough foundation model that can operate software like a human.

This is the brain powering Personal Assistant.

We’re already well above previous state-of-the-art, and we’re improving massively each week.

More details: pic.twitter.com/WTg4Ft6dQZ
— Matt Shumer (@mattshumer_) August 2, 2023

Le coût et la rapidité sont également des questions importantes en raison de la complexité des opérations logicielles, a-t-il ajouté. « Agent-1 » vise à résoudre ce problème. M. Shumer promet beaucoup : « Nous sommes déjà très en avance sur l’état de l’art précédent et nous nous améliorons considérablement chaque semaine ».

Intégration d’un plugin Chrome

L’Agent-1 devrait être intégré à l’assistant personnel d’HyperWrite dans les prochaines mises à jour. Il s’agit d’une extension de navigateur qui fournit un générateur de texte IA indépendant du site web.

À la fin du mois de juin, M. Shumer a présenté une version préliminaire de l’assistant personnel, qui peut effectuer des tâches simples dans le navigateur, telles que l’envoi d’un courrier électronique ou la commande d’un repas.

Cependant, l’agent-1 pourrait prendre en charge des tâches beaucoup plus complexes. Dans la vidéo de démonstration de M. Shumer, vous pouvez voir l’agent-1 contrôler un tableau de bord Google Cloud.

Une pensée dynamique

« Les modèles actuels stockent beaucoup de connaissances, ce qui laisse moins de paramètres pour le raisonnement », explique-t-il. « Au contraire, notre objectif est d’utiliser toute la puissance du modèle pour un raisonnement dynamique

Cette approche de « raisonnement dynamique » permet au modèle de faire face à des situations pour lesquelles il n’a pas été formé. Shumer a placé la barre très haut pour l’Agent-1 :

Notre objectif est de surpasser les capacités humaines – un assistant capable de faire fonctionner n’importe quel logiciel et d’accomplir de manière fiable des objectifs complexes pour le compte de l’utilisateur.
Matt Shumer, PDG de HyperWrite

Comme pour tout agent d’intelligence artificielle, il faut s’attendre à des problèmes, mais Matt Shumer promet que l’Agent-1 s’améliorera avec le temps, en apprenant au fur et à mesure. Dans les semaines à venir, nous verrons si l’Agent-1 tient les promesses de Shumer – à part la brève vidéo, il n’y a pas d’autres informations pour étayer ses affirmations.

Au fait, qu’est-ce que l’ACT-1 déjà ?

L’Agent-1 ressemble beaucoup à la démo ACT-1 d’Adept. La startup américaine n’a pas fait parler d’elle depuis son annonce en septembre 2022, à l’exception d’un tour de table de 350 millions de dollars en série B qui s’est achevé en mars. Elle compte parmi ses fondateurs d’anciens chercheurs de Deepmind, Meta et Google, dont l’un est l’auteur de l’architecture Transformer, qui sert aujourd’hui de base à des modèles tels que GPT-4.

Récemment, l’université de Berkeley et Microsoft Research ont également présenté Gorilla, un grand modèle linguistique qui a été entraîné sur 1 600 interfaces de programmation et qui est capable de faire fonctionner des logiciels.

André Lug

Fondateur de Iglu Online et écrivain du blog André Lug. En tant qu’expert en gestion de projets et marketing numérique, il fournit des contenus sur la productivité, l’entrepreneuriat, des analyses et des résumés de livres.

L’agent 1 peut « utiliser le logiciel comme un humain »

Rejoignez notre liste de diffusion et recevez du contenu exclusif

Intégration d’un plugin Chrome

Une pensée dynamique

Au fait, qu’est-ce que l’ACT-1 déjà ?

André Lug

Laisser un commentaire Annuler la réponse

Abonnez-vous à notre newsletter

OÙ ALLONS-NOUS?