L’agent-1 sera bientôt capable de faire fonctionner n’importe quel logiciel. Dans un premier temps, le modèle d’IA sera publié dans le cadre d’une extension de navigateur.
Matt Shumer, PDG de HyperWriteAI et OthersideAI, a annoncé un modèle de base appelé « Agent-1 ». Il est supposé pouvoir utiliser un logiciel comme un humain. Il n’y a pas encore d’article scientifique disponible, mais il en a fait la démonstration dans une vidéo.
Selon M. Shumer, les modèles d’IA actuels, tels que le GPT-4, et même les modèles de la prochaine génération qui n’ont pas encore été lancés, ne sont pas capables d’utiliser des logiciels et des interfaces de programmation de manière fiable.
Le coût et la rapidité sont également des questions importantes en raison de la complexité des opérations logicielles, a-t-il ajouté. « Agent-1 » vise à résoudre ce problème. M. Shumer promet beaucoup : « Nous sommes déjà très en avance sur l’état de l’art précédent et nous nous améliorons considérablement chaque semaine ».
Intégration d’un plugin Chrome
L’Agent-1 devrait être intégré à l’assistant personnel d’HyperWrite dans les prochaines mises à jour. Il s’agit d’une extension de navigateur qui fournit un générateur de texte IA indépendant du site web.
À la fin du mois de juin, M. Shumer a présenté une version préliminaire de l’assistant personnel, qui peut effectuer des tâches simples dans le navigateur, telles que l’envoi d’un courrier électronique ou la commande d’un repas.
Cependant, l’agent-1 pourrait prendre en charge des tâches beaucoup plus complexes. Dans la vidéo de démonstration de M. Shumer, vous pouvez voir l’agent-1 contrôler un tableau de bord Google Cloud.
Une pensée dynamique
« Les modèles actuels stockent beaucoup de connaissances, ce qui laisse moins de paramètres pour le raisonnement », explique-t-il. « Au contraire, notre objectif est d’utiliser toute la puissance du modèle pour un raisonnement dynamique
Cette approche de « raisonnement dynamique » permet au modèle de faire face à des situations pour lesquelles il n’a pas été formé. Shumer a placé la barre très haut pour l’Agent-1 :
Notre objectif est de surpasser les capacités humaines – un assistant capable de faire fonctionner n’importe quel logiciel et d’accomplir de manière fiable des objectifs complexes pour le compte de l’utilisateur.
Matt Shumer, PDG de HyperWrite
Comme pour tout agent d’intelligence artificielle, il faut s’attendre à des problèmes, mais Matt Shumer promet que l’Agent-1 s’améliorera avec le temps, en apprenant au fur et à mesure. Dans les semaines à venir, nous verrons si l’Agent-1 tient les promesses de Shumer – à part la brève vidéo, il n’y a pas d’autres informations pour étayer ses affirmations.
Au fait, qu’est-ce que l’ACT-1 déjà ?
L’Agent-1 ressemble beaucoup à la démo ACT-1 d’Adept. La startup américaine n’a pas fait parler d’elle depuis son annonce en septembre 2022, à l’exception d’un tour de table de 350 millions de dollars en série B qui s’est achevé en mars. Elle compte parmi ses fondateurs d’anciens chercheurs de Deepmind, Meta et Google, dont l’un est l’auteur de l’architecture Transformer, qui sert aujourd’hui de base à des modèles tels que GPT-4.
Récemment, l’université de Berkeley et Microsoft Research ont également présenté Gorilla, un grand modèle linguistique qui a été entraîné sur 1 600 interfaces de programmation et qui est capable de faire fonctionner des logiciels.