Google DeepMind está desarrollando un sistema de IA llamado Gemini que combinará las capacidades de AlphaGo con modelos lingüísticos avanzados como GPT-4, la tecnología que está detrás de ChatGPT de OpenAI.

Demis Hassabis, CEO de DeepMind, ha declarado a Wired que la experiencia de la empresa en el aprendizaje por refuerzo puede aportar capacidades distintas a Gemini. Utilizando técnicas de AlphaGo como el aprendizaje por refuerzo y la búsqueda en árboles, Gemini pretende ofrecer nuevas capacidades como la resolución de problemas y la planificación.

«A grandes rasgos, se puede pensar que Gemini combina algunas de las ventajas de los sistemas tipo AlphaGo con las increíbles capacidades lingüísticas de los modelos avanzados. También tenemos algunas innovaciones que serán bastante interesantes.»

Demis Hassabis

Gemini se presentó oficialmente en mayo y, según Hassabis, estará en fase de desarrollo y entrenamiento durante unos meses más. Se dice que Gemini tiene capacidades multimodales nunca vistas en modelos anteriores y es muy eficaz en la integración de herramientas y API.

Según Wired, su desarrollo podría costar decenas o cientos de millones de dólares y podría desempeñar un papel clave en la respuesta de Google a ChatGPT y otras tecnologías de IA generativa.

Gemini estará disponible en varios tamaños y está diseñado para soportar futuras innovaciones como la memoria y la planificación. Los rumores de marzo afirmaban que el modelo tendrá un billón de parámetros, como supuestamente tiene GPT-4. Se espera que el proyecto utilice decenas de miles de chips de IA TPU de Google para el entrenamiento.

Mientras tanto, según Sam Altman, CEO de OpenAI, GPT-5 aún está lejos de su lanzamiento y no empezará a entrenarse hasta dentro de seis meses como mínimo. Un lanzamiento en 2024 parece probable. Google DeepMind no ha revelado cuándo se lanzará Gemini.