Google DolphinGemma title

Google revelou um novo modelo de IA chamado DolphinGemma, desenvolvido em colaboração com o Wild Dolphin Project (WDP) e pesquisadores do Georgia Tech. O projeto tem como objetivo entender melhor os padrões de comunicação dos golfinhos-pintados do Atlântico (Stenella frontalis).

O Wild Dolphin Project vem estudando um grupo de golfinhos nas Bahamas por quase 40 anos, construindo um extenso banco de dados com gravações de áudio e vídeo. Essa coleção reúne informações detalhadas sobre os golfinhos individuais, seus sons, comportamentos e interações sociais.

DolphinGemma foi treinado com esses dados e utiliza as tecnologias de áudio do Google, como o tokenizador SoundStream, para converter os sons dos golfinhos em formato digital. O modelo consegue identificar, analisar e até gerar sequências realistas de padrões sonoros típicos – como assobios, cliques e pulsos explosivos – funcionando de forma semelhante a modelos de linguagem humana ao prever os próximos sons de uma sequência.

Levando o DolphinGemma para o ambiente subaquático com smartphones Pixel

Pesquisadores estão implantando o DolphinGemma diretamente em campo, utilizando smartphones Pixel do Google para gravar e analisar dados subaquáticos. Simultaneamente, a equipe emprega o sistema CHAT (Cetacean Hearing Augmentation Telemetry), que associa assobios artificiais especialmente desenvolvidos a objetos específicos, como algas marinhas ou brinquedos, com o objetivo de ensinar os golfinhos a usar esses sons para interagir com os pesquisadores. Um smartphone Pixel identifica em tempo real qual tom o golfinho imita e comunica ao mergulhador qual objeto está sendo solicitado.

Essa combinação de IA, tecnologia móvel e pesquisa de campo de longa duração busca identificar estruturas na linguagem dos golfinhos e, eventualmente, viabilizar uma forma de comunicação simples entre humanos e esses mamíferos marinhos. O Google planeja lançar o DolphinGemma como um modelo aberto no verão de 2025, permitindo que outras equipes de pesquisa o utilizem na análise da comunicação entre mamíferos marinhos.

O DolphinGemma integra os esforços mais amplos do Google para aplicar a IA na pesquisa da comunicação animal, especialmente entre os mamíferos marinhos. Como parte do programa “IA para o Bem Social”, o Google firmou parceria com a NOAA para desenvolver uma IA de detecção de baleias que analisa dados de áudio obtidos por hidrofones, os quais vêm registrando os chamados dos mamíferos marinhos em doze localidades do Pacífico desde 2005. Recentemente, um modelo de IA do Google também ajudou a identificar um som misterioso subaquático como um chamado, até então desconhecido, da baleia de Bryde – o som, descrito como “Biotwang”, foi identificado a partir da combinação de avistamentos visuais e gravações acústicas.

O Earth Species Project também está empenhado na criação de representações para a comunicação animal, tanto para espécies individuais quanto para múltiplas espécies simultaneamente. Entre seus objetivos está a compreensão de formas não verbais de comunicação, como as danças das abelhas.

Resumo

  • O Google, em colaboração com o Wild Dolphin Project e o Georgia Tech, desenvolveu o modelo de IA DolphinGemma, capaz de analisar sons de golfinhos e gerar sequências realistas para melhor compreender a comunicação dos golfinhos-pintados do Atlântico.
  • O modelo foi treinado com décadas de gravações de áudio e vídeo de um grupo de golfinhos, utilizando tecnologias como o SoundStream para processar digitalmente e prever padrões sonoros típicos, como assobios e cliques.
  • O DolphinGemma é implantado diretamente em campo com smartphones Pixel e, em conjunto com o sistema CHAT, ensina os golfinhos a associar sons artificiais a objetos, com o objetivo de estabelecer uma comunicação direta entre humanos e golfinhos.