gemini live video demo

O Google confirmou no Mobile World Congress (MWC) em Barcelona que as capacidades visuais previamente anunciadas para o Gemini serão lançadas este mês.

De acordo com o anúncio, os assinantes do Google One AI Premium com o Gemini Advanced em breve poderão utilizar as funções de análise de vídeo ao vivo e compartilhamento de tela.

A atualização, batizada de Gemini Live, traz dois recursos principais: análise de vídeo em tempo real pela câmera e compartilhamento de tela. Ambos permitem que os usuários compartilhem conteúdo visual com o assistente de IA conforme ele ocorre – seja direcionando a câmera para o ambiente ao redor ou compartilhando a tela do smartphone para obter um retorno instantâneo.

Esses recursos serão disponibilizados inicialmente exclusivamente em dispositivos Android e contarão com suporte a múltiplos idiomas. Durante o MWC, o Google demonstrou o Gemini Live em dispositivos parceiros de diversos fabricantes de Android.

Expandindo a IA para interações no mundo real

Ao adicionar a interação visual, o Google dá um importante passo rumo aos assistentes de IA multimodais – sistemas capazes de integrar múltiplas formas de entrada para interagir de maneira mais natural com o mundo real.

A visão mais ampla do Google para 2025, conhecida como “Projeto Astra”, contempla um assistente universal multimodal, projetado para processar dados de texto, vídeo e áudio em tempo real, mantendo o contexto da conversa por até dez minutos. O Astra também seria integrado de forma próxima ao Google Search, Lens e Maps.

Embora não esteja claro se o Astra será lançado como um produto separado ou se suas funcionalidades serão incorporadas ao Gemini – o que parece mais provável – o lançamento do Gemini Live ajuda o Google a acompanhar o ritmo do ChatGPT da OpenAI, que vem oferecendo vídeo ao vivo e compartilhamento de tela por meio do seu Modo de Voz Avançado desde dezembro.

Resumo

  • O Google está implementando funcionalidades de vídeo ao vivo e compartilhamento de tela para seu assistente de IA Gemini, disponíveis para os assinantes do Google One AI Premium com o Gemini Advanced a partir deste mês.
  • Os usuários poderão compartilhar e analisar vídeos em tempo real, seja através da câmera do smartphone ou do conteúdo exibido na tela, oferecendo uma assistência mais interativa e contextualizada. Esses recursos estarão disponíveis inicialmente apenas em dispositivos Android.
  • A inclusão de capacidades visuais representa um avanço significativo para os assistentes de IA, que passam a atender à crescente expectativa dos usuários de compreender e responder a diversas formas de mídia e interagir de maneira natural com o ambiente físico.