GettyImages 2197091379

OpenAI aposta alto no áudio enquanto Silicon Valley declara guerra às telas

A OpenAI está investindo fortemente em inteligência artificial para áudio, e não se trata apenas de melhorar a sonoridade do ChatGPT. Segundo reportagem do The Information, a empresa unificou diversas equipes de engenharia, produto e pesquisa nos últimos dois meses para reformular seus modelos de áudio, preparando o lançamento de um dispositivo pessoal com foco em áudio, previsto para cerca de um ano.

Essa iniciativa reflete o caminho que toda a indústria de tecnologia está trilhando: um futuro em que as telas se tornam ruído de fundo e o áudio assume o protagonismo. Caixas inteligentes já transformaram assistentes de voz em presença fixa em mais de um terço das residências nos Estados Unidos. Por exemplo, a Meta lançou recentemente um recurso para seus óculos inteligentes Ray-Ban que utiliza um conjunto com cinco microfones para ajudar a ouvir conversas em ambientes barulhentos, transformando o rosto em um dispositivo de escuta direcional. Enquanto isso, o Google começou a experimentar, em junho, os “Audio Overviews”, que convertem resultados de busca em resumos conversacionais. A Tesla também está integrando modelos de linguagem em seus veículos para criar assistentes de voz capazes de gerenciar desde a navegação até o controle climático por meio de diálogos naturais.

Não são apenas os gigantes da tecnologia que estão nessa aposta. Diversas startups emergiram com a mesma convicção, embora com graus variados de sucesso. Os criadores do Humane AI Pin chegaram a gastar centenas de milhões antes que seu dispositivo vestível sem tela se tornasse um alerta sobre os riscos dessa abordagem. Já o colar Friend AI, que registra momentos da vida e oferece companhia, despertou preocupações quanto à privacidade e um certo temor existencial. Agora, pelo menos duas empresas – uma delas liderada pelo fundador da Pebble – estão desenvolvendo anéis com inteligência artificial, com lançamento esperado para 2026, permitindo que os usuários literalmente “conversem com a mão”.

Embora os formatos sejam distintos, a tese é a mesma: o áudio é a interface do futuro. Cada espaço — sua casa, seu carro, até mesmo o seu rosto — está se transformando em uma interface.

O novo modelo de áudio da OpenAI, previsto para o início de 2026, deverá contar com uma sonoridade mais natural, lidar com interrupções como um verdadeiro interlocutor e até falar enquanto você fala, algo que os modelos atuais não conseguem fazer. A expectativa é de que a empresa desenvolva uma família de dispositivos – possivelmente incluindo óculos ou caixas inteligentes sem tela – que funcionem menos como ferramentas e mais como companheiros.

Conforme destacado pelo The Information, o ex-chefe de design da Apple, Jony Ive, que se integrou aos esforços de hardware da OpenAI após a aquisição de sua empresa por US$ 6,5 bilhões, tem como prioridade reduzir a dependência dos dispositivos, enxergando no design voltado para o áudio uma oportunidade de “corrigir os erros” dos gadgets de consumo do passado.