A Google confirmou a existência do Projeto Gemini. A Google apresentou o PaLM-2 no Google I/O, chamando-o de modelo de linguagem de próxima geração.

Comparado ao seu predecessor, o PaLM, diz-se que ele é capaz de falar mais línguas, raciocinar melhor e codificar melhor. O PaLM-2 foi treinado com textos de mais de 100 línguas diferentes, numerosas publicações científicas, sites matemáticos e bancos de dados de código.

O modelo PaLM-2 mais pequeno é esperado para ser executado em dispositivos móveis

Não há detalhes exatos sobre o tamanho, mas de acordo com o Google, o modelo estará disponível em quatro tamanhos diferentes: Gecko, Otter, Bison e Unicorn. O mais pequeno, Gecko, será até capaz de executar em dispositivos móveis, permitindo aplicações interativas no dispositivo – mesmo quando o dispositivo estiver offline.

O PaLM-2 também alimenta o chatbot Bard da Google, bem como recursos de IA em aplicativos de trabalho, como o Gmail e o Google Docs. O modelo de linguagem da Google também está disponível em duas variantes especializadas: Med-PaLM-2 para medicina e Sec-PaLM para aplicações de cibersegurança. O modelo Med-PaLM-2 adicionará capacidades multimodais, como a capacidade de avaliar diretamente raios-x.

PaLM-2 e os modelos especiais estão disponíveis – com restrições – por meio da API PaLM do Google.

“Projeto Gemini” já está em desenvolvimento

Com o anúncio do PaLM-2, o Google também comentou sobre a fusão das equipes Brain e DeepMind e os rumores do “Projeto Gemini”. A equipe está pavimentando “o caminho para a próxima geração de modelos de IA” e já está trabalhando no Gemini, o próximo modelo multimodal do Google.

Segundo o Google, o Gemini é multimodal desde o início, altamente eficiente na integração de ferramentas e APIs, e projetado para futuras inovações, como memória e planejamento. O Gemini ainda está em treinamento, mas, de acordo com o anúncio, já mostra capacidades multimodais não vistas em modelos anteriores.

“Uma vez ajustado e rigorosamente testado quanto à segurança, o Gemini estará disponível em vários tamanhos e capacidades, assim como o PaLM 2, para garantir que possa ser implantado em diferentes produtos, aplicativos e dispositivos para o benefício de todos”, disse o Google.