Testamos os óculos de IA do Google e eles estão quase prontos
Na conferência para desenvolvedores do Google I/O desta semana, tivemos a oportunidade de experimentar brevemente os óculos com tecnologia de inteligência artificial que estão por vir – não os óculos de áudio exclusivamente, anunciados para serem lançados neste outono, mas os que oferecem uma experiência combinada de áudio e visual.
Anunciados pela primeira vez no evento do ano passado, esses óculos Android XR contam com um visor embutido que projeta informações úteis diante dos seus olhos, sobrepondo o mundo real. Entre essas informações, estão widgets que podem exibir dados como condições climáticas, direções de caminhada, detalhes para a retirada de um Uber, tradução simultânea e muito mais – inclusive widgets personalizados desenvolvidos com o auxílio da IA.

Conforme informado pelo Google, os óculos poderão ser emparelhados tanto com aparelhos iOS quanto com Android, tanto na versão de áudio quanto na futura versão com exibição visual.
A versão com display foi planejada como o próximo passo além da primeira geração de óculos apenas com áudio, que será lançada ainda este ano. Desenvolvidos em parceria com Warby Parker, Gentle Monster e Samsung, os óculos combinam a tecnologia do Google com as estéticas de design de cada marca.
Os dispositivos que testamos ainda eram claramente protótipos, embora com acabamento polido o suficiente para serem avaliados externamente. Os representantes que demonstraram os óculos XR explicaram que, com o protótipo, o Google não precisava se preocupar com detalhes cosméticos relativos a diferentes estilos e formatos, podendo focar na experimentação da tecnologia do display e seus impactos na duração da bateria. Isso significa que esses óculos são muito diferentes da versão final que será lançada, em termos de ajuste, formato, dimensões e atenção aos detalhes. Trata-se, principalmente, de uma oportunidade para testar os “interiores” dos óculos dentro de uma armação básica e confortável.
A versão de lançamento será capaz de detectar quando os óculos são colocados ou retirados da cabeça, recurso que não estava presente no protótipo que experimentamos.

Para ativar o Gemini, bastava pressionar o lado direito da armação por dois segundos. Um sinal sonoro indicava que o Gemini estava ativo e escutando. Na versão de demonstração, a ativação do Gemini também acionava a câmera ao mesmo tempo, mas na versão final o usuário poderá configurar se deseja ou não ligar a câmera junto com o Gemini.
Em um teste inicial, reproduzimos música através dos óculos, solicitando ao Gemini que tocasse um artista favorito. O ambiente estava muito ruidoso para avaliar a qualidade do som, pois o volume estava no máximo e o áudio, apesar de presente, era difícil de ouvir com clareza e detalhes. A impressão inicial foi de que os óculos não seriam um substituto ideal para fones de ouvido de alta qualidade, mas poderiam ser bastante úteis para ouvir música enquanto se caminha, faz trilhas ou realiza tarefas domésticas. A vantagem de não usar fones é que você consegue ouvir melhor uma conversa, em comparação com os modos de transparência presentes em dispositivos como os AirPods da Apple.
Para desligar a música, basta dar um toque na lateral da armação, aproximadamente na altura da têmpora.

Em um segundo teste, pressionamos o botão de captura de foto com o dedo para tirar a imagem de uma pessoa. Sem o visor ativado, a foto era transferida para o telefone e para o relógio. Posteriormente, será possível capturar vídeos com uma pressão longa, porém essa opção não estava disponível para testes com o protótipo. No caso do vídeo, uma prévia em miniatura apareceria no visor em vez da foto.
Também é possível simplesmente pedir ao Gemini que tire uma foto sem precisar acionar o botão, inclusive solicitando alguma manipulação de IA no resultado. Por exemplo, você pode dizer “tire uma foto e transforme a pessoa em um personagem de anime”. A imagem é enviada para o telefone, depois para os servidores Gemini e Nano Banana, e em seguida retorna em sua versão editada. Durante o evento do Google I/O, em um ambiente com Wi-Fi congestionado, esse processo levou cerca de 45 segundos.

Com o display ativado, uma tela inicial simples surgia no campo de visão. Na versão de demonstração, alguns widgets pré-carregados mostravam o clima e uma contagem regressiva para o evento do Google I/O. Também era possível criar atalhos para aplicativos específicos, como Google Maps ou Translate, caso esses fossem alguns dos principais usos para os óculos.
Embora o protótipo contasse com apenas um display sobre o olho direito, a plataforma suporta tanto displays únicos quanto duplos, bem como versões somente com áudio. A imagem do display, um pouco desfocada inicialmente, atribuímos aos nossos óculos de grau – um lente otimizada para distância de um lado e outra otimizada para visão de perto do outro. Ao fechar um dos olhos, a imagem ganhava melhor nitidez, embora a experiência rapidamente causasse um pouco de tensão ocular no lado direito, sem que estivesse claro se a prescrição dos contatos seria a única causa.

Um dos melhores testes foi a demonstração da tradução de idiomas com os óculos, recurso suportado pelo aplicativo Google Translate no telefone. Durante a demonstração, um dos apresentadores falava espanhol rapidamente, e os óculos detectavam automaticamente o idioma, exibindo o texto em inglês no display, enquanto o Gemini transmitia o áudio em inglês diretamente para o ouvinte. Bastaria para que viajantes do mundo inteiro se interessassem pelo produto apenas por essa funcionalidade.
É importante ressaltar que o Translate funcionará também nos óculos de áudio, embora sem a exibição do texto; nesse caso, a transcrição poderá ser visualizada no telefone juntamente com o feedback em áudio em tempo real.
Outra demonstração envolveu o uso dos óculos para navegação. Embora não pudéssemos sair em uma caminhada para testar sua acurácia em campo, foi possível ter uma boa ideia de seu funcionamento. Você inicia o Google Maps dizendo ao Gemini para navegar até um destino – que pode ser tão vago quanto “a cafeteria mais próxima”.
O Gemini ativa o Google Maps no telefone, sem que seja necessário retirá-lo do bolso ou da bolsa. Após um breve atraso enquanto a experiência era carregada, os óculos exibiam instruções de navegação passo a passo. Ao olhar para frente, surgiam informações sobre a próxima virada; se precisasse se orientar melhor, bastava baixar o olhar para ver seu ponto azul em um mapa. Virando a cabeça para os lados, era possível ajustar a rotação do mapa, de forma semelhante ao ajuste feito no telefone.
Ao levantar o olhar novamente, era possível continuar caminhando sem que o mapa atrapalhasse. Como a experiência está vinculada ao Google Maps do telefone, destinos salvos como “casa” e “trabalho” já aparecerão disponíveis.

Também tivemos a oportunidade de usar os óculos para identificar diversos objetos no ambiente e fazer perguntas sobre eles. Inicialmente, os óculos tiveram dificuldade em identificar uma réplica de uma pintura de Monet exposta em uma prateleira – isso ocorreu porque o protótipo não ativava automaticamente a câmera, sendo necessário ligá-la manualmente pelo aplicativo. Mesmo assim, após algumas tentativas, o Gemini identificou a obra como tendo semelhanças com Monet, inclusive quando nos aproximamos para focar na assinatura do pintor no canto inferior esquerdo.
Outros testes foram mais tranquilos, com os óculos identificando imediatamente uma planta na prateleira e respondendo a perguntas sobre receitas de um livro. Esses recursos já podem ser executados hoje, por meio do Google Lens ou de outros modelos de IA integrados a aplicativos de chatbot. No entanto, é interessante a possibilidade de realizá-los sem precisar retirar o telefone do bolso.
O Google garantirá mais informações sobre os óculos com display Android XR ainda este ano, quando ampliar seu programa de testadores confiáveis.

No ínterim, a empresa acredita que a versão com áudio pode suprir as necessidades de alguns usuários, possivelmente uma estratégia inteligente para amenizar o fato de que os óculos com display ainda não estão prontos, mesmo com a concorrência de empresas como Meta e Snap nesse segmento.
Assim como a versão com display, os óculos apenas com áudio também dão acesso ao Google Gemini, que é transmitido privadamente através dos alto-falantes embutidos na armação. Com eles, é possível ouvir música, pressionar um botão para tirar uma foto, fazer chamadas ou acessar aplicativos do telefone – funcionalidades que estarão presentes nas versões futuras com display.
Embora ainda não tenhamos testado a integração com aplicativos de terceiros, os óculos permitirão que os usuários solicitem ao Gemini tarefas como, por exemplo, “pegar os ingredientes desta receita e adicioná-los à minha lista de compras”. Em outra demonstração apresentada no evento, os óculos conseguiram observar o preparo de uma refeição no fogão e oferecer feedback sobre ela, como se a carne já estivesse totalmente cozida ou não.
