O Google não consegue ou não deseja reprimir o conteúdo gerado por IA em suas buscas, então os spammers de conteúdo se aproveitam disso. E o Google lucra com isso.

De acordo com um estudo da Newsguard, uma empresa de tecnologia que avalia a qualidade das notícias e informações na web, 141 marcas estão provavelmente colocando anúncios programáticos em sites de baixa qualidade gerados por IA que têm “pouca ou nenhuma supervisão humana”.

A Newsguard classifica esses sites como “Notícias Geradas por Inteligência Artificial Não Confiáveis” (UAIN, na sigla em inglês). Somente no último mês, essa categoria cresceu de 49 para 217 sites rastreados, segundo o estudo. A identificação revela cerca de 25 novos sites UAIN por semana.

Os sites são identificados utilizando mensagens de erro de modelos de IA como o ChatGPT, que exibe “Como modelo de linguagem de IA” nas respostas. Por ser um método inerentemente impreciso, a Newsguard presume que há um alto número de sites não detectados.

Esses sites utilizam chatbots como o ChatGPT para gerar artigos ou reescrever artigos existentes de grandes editoras. A qualidade aparenta ser suficientemente boa para evitar a detecção pelos sistemas antispam das empresas de tecnologia de publicidade. Segundo informações, um dos sites estudados publica mais de 1.200 artigos por dia. Cada artigo é usado como espaço publicitário.

O Google lucra com spam gerado por IA

Em 55 dos sites classificados como UAIN, 141 marcas reconhecidas veicularam um total de 393 anúncios programáticos. Os anúncios foram exibidos nos Estados Unidos, Alemanha, França e Itália.

Desses 393 anúncios, 356, ou seja, mais de 90%, foram provenientes do Google Ads, o próprio serviço do Google para exibição de anúncios em sites. O Google ganha dinheiro a cada anúncio veiculado.

Os anunciantes podem optar por não exibir anúncios em determinados sites. No entanto, isso requer uma pesquisa extensiva e demanda tempo para ser mantido.

Com o Ads e o AdSense, o Google controla os lances dos anunciantes e a exibição nos sites onde os anúncios dos anunciantes aparecem.

Através do Google Search e de serviços como o News e o Discover, o Google também influencia a visibilidade das páginas em que seus próprios anúncios são exibidos.

Para os editores ocidentais, em particular, o Google é, na maioria dos casos, a fonte de tráfego mais importante. Ser penalizado ou ignorado pelo Google é praticamente o mesmo que sair do negócio.

O dilema do conteúdo de IA do Google

O Google enfrenta um dilema quando se trata de conteúdo de IA: por um lado, uma enorme quantidade de conteúdo gerado automaticamente ameaça seu principal negócio de busca, à medida que a internet aberta se torna cada vez mais congestionada e, portanto, mais difícil de controlar.

No entanto, seria uma postura contraditória o Google rejeitar completamente o conteúdo gerado por IA de outros, ao mesmo tempo em que integra textos gerados por IA em grande escala na experiência de busca com o Search Generative Experience. Mesmo que o Google quisesse desvalorizar o conteúdo de IA, não está claro se isso seria tecnicamente viável.

Recentemente, o Google afirmou que não tomaria medidas abrangentes contra o conteúdo de IA se ele fosse útil. No entanto, isso parece ter mudado: em abril de 2022, o porta-voz do mecanismo de busca do Google, John Mueller, afirmou que o conteúdo de IA é um conteúdo gerado automaticamente que violaria as diretrizes para webmasters. “Portanto, consideraríamos isso como spam”, disse Mueller.

Parte da verdade pode ser que não seja uma solução para o Google classificar o conteúdo de IA como spam quando grandes segmentos de negócios e da sociedade usam geradores de texto – e que a detecção confiável de conteúdo gerado por IA seja cara ou impossível. Com o Bard, o Google até oferece seu próprio gerador de texto.

O problema do spam não é novo. Mesmo com o GPT-3, os usuários iniciais geravam blogs falsos com conteúdo genérico sobre conselhos de vida ou autotransformação, que facilmente atraíam milhares de leitores que até mesmo comentavam neles, acreditando estar lidando com seres humanos.

No entanto, a pesquisa da Newsguard mostra pela primeira vez como o crescimento massivo nessa área está sendo impulsionado por modelos de linguagem cada vez mais poderosos e acessíveis.