Con el nuevo modelo multimodal de IA Gemini, Google busca al menos igualar a GPT-4 de OpenAI. Las primeras pruebas están en marcha.

Según tres fuentes anónimas de The Information, Google ha brindado acceso a una versión de chat simplificada de Gemini a un pequeño grupo de empresas seleccionadas. Las tres fuentes afirman tener conocimiento directo del asunto. La versión completa de Gemini aún se encuentra en desarrollo interno.

El primer ensayo con clientes externos podría ser un indicativo de que el lanzamiento de Gemini se acerca cada vez más. Google ya lo había anunciado para este año. Informes anteriores sugerían que sería lanzado en otoño.

Gemini se ofrecerá a las empresas a través del acceso en la nube y se integrará en los productos de consumo de Google. Google planea utilizar Gemini para todas sus aplicaciones de IA, desde el chatbot Bard hasta las nuevas funciones de IA en Workspace.

A través del servicio Vertex AI, Google planea ofrecer modelos de diferentes tamaños. Los modelos más pequeños podrían realizar tareas más simples a un costo menor.

Los datos de los usuarios de Google podrían darle ventaja a Gemini

Una gran ventaja, según un probador, es que Google puede procesar datos de sus productos, como la Búsqueda de Google, además de información pública en la web. Esto podría hacer que el modelo comprenda mejor la intención del usuario que GPT-4. También podría resultar en menos respuestas incorrectas, según la fuente.

Se dice que la generación de código de Gemini es lo suficientemente buena como para que Google espere competir con el GitHub Copilot de Microsoft. También se están discutiendo características como analizar gráficos e interpretar datos, así como realizar acciones en la computadora, como en el navegador, utilizando comandos de voz.

Varios modelos Gemini

Gemini, según The Information, es «un conjunto de grandes modelos de lenguaje» que pueden realizar diversas tareas, como chatbots, resúmenes de texto, codificación o generación de nuevo texto. No está claro si Gemini contará con modelos especializados en red, como lo hace OpenAI con su arquitectura GPT-4.

Gemini fue anunciado oficialmente en mayo. Los primeros rumores sugieren que el modelo tendrá al menos un billón de parámetros. Se espera que el entrenamiento utilice decenas de miles de chips TPU AI de Google.

Demis Hassabis, el gerente principal de Gemini, dijo a finales de junio que Gemini combinará algunas de las fortalezas del sistema AlphaGo con las capacidades de lenguaje de grandes modelos.