Google amplia a função “Audio Overviews” para 75 idiomas com produção de áudio baseada no Gemini
O recurso “Audio Overviews” do NotebookLM já está disponível em aproximadamente 75 idiomas, incluindo línguas menos comuns como islandês, basco e latim. Em cada idioma, o áudio é gerado por agentes de IA que utilizam a técnica de “metaprompting” com o modelo de linguagem Gemini 2.5 Pro como base.
Em paralelo, o Google está migrando para uma tecnologia de produção de áudio baseada inteiramente na multifuncionalidade do Gemini, o que representa um desafio para os provedores que se concentram exclusivamente em modelos de áudio. Assim como ocorre com textos gerados por IA, áudios produzidos por esses modelos podem conter imprecisões, especialmente em podcasts gerados por inteligência artificial, onde grandes quantidades de áudio são criadas a partir de uma fonte textual mínima e a conversão do texto em diálogo altera significativamente o conteúdo original.
Para saber mais sobre os avanços na tecnologia de produção de áudio baseada em IA, acesse este link.