Avec le nouveau modèle d’IA multimodal Gemini, Google vise au moins à égaler le GPT-4 de OpenAI. Les premiers tests sont en cours.

Selon trois sources anonymes de The Information, Google a donné à un petit groupe d’entreprises sélectionnées un accès à une version allégée de Gemini. Les trois sources prétendent avoir une connaissance directe du sujet. La version complète de Gemini est toujours en cours de développement en interne.

La première expérience avec des clients externes peut indiquer que le lancement de Gemini se rapproche de plus en plus. Google l’avait déjà annoncé pour cette année. Des rapports précédents indiquaient qu’il serait lancé à l’automne.

Gemini sera proposé aux entreprises via un accès cloud et intégré aux produits grand public de Google. Google prévoit d’utiliser Gemini pour toutes ses applications d’IA, du chatbot Bard aux nouvelles fonctionnalités d’IA dans Workspace.

Par le biais du service Vertex AI, Google prévoit de proposer différents tailles de modèle. Les modèles plus petits pourraient effectuer des tâches plus simples à moindre coût.

Les données des utilisateurs de Google peuvent donner un avantage à Gemini

Un grand avantage, selon un testeur, est que Google peut traiter les données de ses produits, comme la recherche Google, ainsi que des informations publiques sur le Web. Cela pourrait permettre au modèle de mieux comprendre l’intention de l’utilisateur que GPT-4. Cela pourrait également entraîner moins de réponses incorrectes, selon la source.

La génération de code de Gemini serait suffisamment performante pour que Google espère rivaliser avec le Copilot de GitHub de Microsoft. Des fonctionnalités telles que l’analyse de graphiques et l’interprétation des données, ainsi que l’exécution d’actions sur l’ordinateur, comme dans le navigateur, en utilisant des commandes vocales, sont également en discussion.

Plusieurs modèles Gemini

Gemini, selon The Information, est « un ensemble de grands modèles de langage » capables d’effectuer diverses tâches telles que des chatbots, la synthèse de texte, la génération de code ou la création de nouveau texte. Il n’est pas clair si Gemini comprendra des modèles spécialisés en réseau, comme le fait OpenAI avec son architecture GPT-4.

Gemini a été officiellement annoncé en mai. Les premières rumeurs suggèrent que le modèle aura au moins un billion de paramètres. On s’attend à ce que la formation utilise des dizaines de milliers de puces d’IA TPU de Google.

Demis Hassabis, directeur principal de Gemini, a déclaré à la fin de juin que Gemini combinerait certaines forces du système AlphaGo avec les capacités de langage des grands modèles.