Google DeepMind développe un système d’IA appelé Gemini qui combinera les capacités d’AlphaGo avec des modèles de langage avancés tels que GPT-4, la technologie qui sous-tend ChatGPT d’OpenAI.

Demis Hassabis, PDG de DeepMind, a déclaré à Wired que l’expertise de l’entreprise en matière d’apprentissage par renforcement pouvait apporter des capacités distinctes à Gemini. En utilisant les techniques d’AlphaGo telles que l’apprentissage par renforcement et la recherche arborescente, Gemini vise à offrir de nouvelles capacités telles que la résolution de problèmes et la planification.

« D’une manière générale, on peut considérer que Gemini combine certains des avantages des systèmes de type AlphaGo avec les incroyables capacités linguistiques des modèles avancés. Nous avons également quelques nouvelles innovations qui seront très intéressantes. »

Demis Hassabis

Gemini a été officiellement dévoilé en mai et, selon M. Hassabis, il sera en phase de développement et de formation pendant encore quelques mois. Gemini aurait des capacités multimodales jamais vues dans les modèles précédents et serait très efficace dans l’intégration d’outils et d’API.

Selon Wired, le développement du système pourrait coûter des dizaines ou des centaines de millions de dollars et pourrait jouer un rôle clé dans la réponse de Google à ChatGPT et à d’autres technologies d’IA générative.

Gemini sera disponible en différentes tailles et est conçu pour prendre en charge les innovations futures telles que la mémoire et la planification. En mars, des rumeurs affirmaient que le modèle aurait un trillion de paramètres, tout comme le GPT-4. Le projet devrait utiliser des dizaines de milliers de puces d’intelligence artificielle TPU de Google pour l’entraînement.

Selon Sam Altman, PDG d’OpenAI, GPT-5 est encore loin d’être lancé et ne commencera pas à s’entraîner avant au moins six mois. Un lancement en 2024 semble probable. Google DeepMind n’a pas révélé la date de lancement de Gemini.