O Google DeepMind está desenvolvendo um sistema de IA chamado Gemini que combinará as capacidades do AlphaGo com modelos de linguagem avançados como o GPT-4, a tecnologia por trás do ChatGPT da OpenAI.
O CEO da DeepMind, Demis Hassabis, disse à Wired que a experiência da empresa em aprendizado por reforço pode fornecer recursos distintos ao Gemini. Utilizando técnicas do AlphaGo, como aprendizado por reforço e busca em árvore, o Gemini tem como objetivo oferecer novas capacidades, como solução de problemas e planejamento.
“Em termos gerais, você pode pensar no Gemini como a combinação de algumas das vantagens dos sistemas do tipo AlphaGo com as incríveis habilidades linguísticas dos modelos avançados. Também temos algumas inovações novas que serão bastante interessantes.”
Demis Hassabis
O Gemini foi oficialmente revelado em maio e, segundo Hassabis, estará em desenvolvimento e treinamento por mais alguns meses. Diz-se que o Gemini possui capacidades multimodais nunca vistas em modelos anteriores e é altamente eficiente na integração de ferramentas e APIs.
Segundo a Wired, o sistema poderia custar dezenas ou centenas de milhões de dólares para ser desenvolvido e poderia desempenhar um papel fundamental na resposta do Google ao ChatGPT e outras tecnologias de IA generativa.
O Gemini estará disponível em vários tamanhos e foi projetado para suportar futuras inovações, como memória e planejamento. Rumores em março afirmaram que o modelo terá um trilhão de parâmetros, assim como supostamente o GPT-4 possui. O projeto deve utilizar dezenas de milhares de chips de IA TPU da Google para o treinamento.
Enquanto isso, segundo o CEO da OpenAI, Sam Altman, o GPT-5 ainda está longe de ser lançado e não começará o treinamento antes de pelo menos seis meses. Um lançamento em 2024 parece provável. O Google DeepMind não revelou quando o Gemini será lançado.