Com o novo modelo de IA multimodal Gemini, o Google quer pelo menos alcançar o GPT-4 da OpenAI. Os primeiros testes estão em andamento.

De acordo com três fontes anônimas do The Information, o Google deu a um pequeno grupo de empresas selecionadas acesso a uma versão de bate-papo despojada do Gemini. As três fontes afirmam ter conhecimento direto do assunto. A maior versão do Gemini ainda está sendo desenvolvida internamente.

O primeiro teste com clientes externos pode ser um indicativo de que o lançamento do Gemini está cada vez mais próximo. O Google já havia anunciado para este ano. Relatórios anteriores diziam que ele seria lançado no outono.

O Gemini será oferecido às empresas por meio de acesso à nuvem e integrado aos produtos de consumo do Google. O Google planeja usar o Gemini para todos os seus aplicativos de IA, desde o chatbot Bard até os novos recursos de IA no Workspace.

Por meio do serviço Vertex AI, o Google planeja oferecer diferentes tamanhos de modelo. Modelos menores poderiam executar tarefas mais simples a um custo menor.

Dados de usuários do Google podem dar vantagem a Gemini

Uma grande vantagem, segundo um testador, é que o Google pode processar dados de seus produtos, como a Pesquisa Google, além de informações públicas da Web. Isso poderia fazer com que o modelo entendesse melhor a intenção do usuário do que o GPT-4. Também poderia resultar em menos respostas incorretas, de acordo com a fonte.

A geração de código do Gemini é supostamente boa o suficiente para que o Google espere competir com o GitHub Copilot da Microsoft. Recursos como analisar gráficos e interpretar dados, bem como realizar ações no computador, como no navegador, usando comandos de voz, também estão sendo discutidos.

Vários modelos Gemini

Gêmeos, de acordo com o The Information, é “um conjunto de grandes modelos de linguagem” que podem executar várias tarefas, como chatbots, resumo de texto, código ou geração de novo texto. Não está claro se o Gemini contará com modelos especialistas em rede, como a OpenAI faz com sua arquitetura GPT-4.

Gêmeos foi anunciado oficialmente em maio. Os primeiros rumores sugerem que o modelo terá pelo menos um trilhão de parâmetros. Espera-se que o treinamento use dezenas de milhares de chips TPU AI do Google.

Demis Hassabis, gerente principal da Gemini, disse no final de junho que a Gemini combinará alguns pontos fortes do sistema AlphaGo com os recursos de linguagem de grandes modelos.