Google no puede o no quiere tomar medidas enérgicas contra los contenidos generados por IA en sus búsquedas, por lo que los spammers de contenidos se aprovechan de ello. Y Google se beneficia de ello.

Según un estudio de Newsguard, una empresa tecnológica que evalúa la calidad de las noticias y la información en la web, es probable que 141 marcas coloquen anuncios programáticos en sitios de baja calidad generados por IA que tienen «poca o ninguna supervisión humana».

Newsguard clasifica estos sitios como «noticias generadas por inteligencia artificial no fiables» (UAIN). Sólo en el último mes, esta categoría ha pasado de 49 a 217 sitios rastreados, según el estudio. La identificación revela unos 25 nuevos sitios UAIN por semana.

Los sitios se identifican utilizando mensajes de error de modelos de IA como ChatGPT, que muestran «As AI language model» en las respuestas. Dado que se trata de un método inherentemente impreciso, Newsguard asume que existe un elevado número de sitios no detectados.

Estos sitios utilizan chatbots como ChatGPT para generar artículos o reescribir artículos existentes de grandes editores. La calidad parece ser lo bastante buena como para evitar ser detectados por los sistemas antispam de las empresas de tecnología publicitaria. Uno de los sitios web estudiados publica más de 1.200 artículos al día. Cada artículo se utiliza como espacio publicitario.

Google se beneficia del spam generado por IA

En 55 de los sitios clasificados como UAIN, 141 marcas reconocidas publicaron un total de 393 anuncios programáticos. Los anuncios se mostraron en Estados Unidos, Alemania, Francia e Italia.

De esos 393 anuncios, 356, es decir, más del 90%, procedían de Google Ads, el servicio propio de Google para mostrar anuncios en sitios web. Google gana dinero por cada anuncio publicado.

Los anunciantes pueden optar por no mostrar anuncios en determinados sitios web. Sin embargo, esto requiere una investigación exhaustiva y su mantenimiento lleva mucho tiempo.

Con Ads y AdSense, Google controla las ofertas de los anunciantes y la visualización en los sitios en los que aparecen sus anuncios.

A través de Google Search y de servicios como News y Discover, Google también influye en la visibilidad de las páginas en las que se muestran sus propios anuncios.

Para los editores occidentales en particular, Google es, en la mayoría de los casos, la fuente de tráfico más importante. Ser penalizado o ignorado por Google equivale prácticamente a quebrar.

El dilema de Google con los contenidos de IA

Google se enfrenta a un dilema en lo que se refiere a los contenidos de IA: por un lado, una enorme cantidad de contenidos generados automáticamente amenaza su negocio principal de búsqueda, ya que la Internet abierta está cada vez más congestionada y, por tanto, es más difícil de controlar.

Sin embargo, sería contradictorio que Google rechazara por completo los contenidos generados por IA de terceros y, al mismo tiempo, integrara a gran escala el texto generado por IA en la experiencia de búsqueda con Search Generative Experience. Incluso si Google quisiera devaluar el contenido generado por IA, no está claro si esto sería técnicamente factible.

Recientemente, Google dijo que no tomaría medidas exhaustivas contra el contenido de IA si era útil. Sin embargo, eso parece haber cambiado: en abril de 2022, el portavoz del motor de búsqueda de Google, John Mueller, dijo que el contenido de IA es contenido autogenerado que violaría las directrices para webmasters. «Así que lo consideraríamos spam», dijo Mueller.

Parte de la verdad puede ser que para Google no es una solución clasificar el contenido de IA como spam cuando grandes segmentos de las empresas y la sociedad utilizan generadores de texto, y que la detección fiable del contenido generado por IA es cara o imposible. Con Bard, Google ofrece incluso su propio generador de texto.

El problema del spam no es nuevo. Incluso con GPT-3, los primeros usuarios generaban blogs falsos con contenidos genéricos sobre consejos de vida o autotransformación, que atraían fácilmente a miles de lectores que incluso los comentaban, creyendo que estaban tratando con seres humanos.

Sin embargo, la investigación de Newsguard muestra por primera vez cómo el crecimiento masivo en este ámbito está siendo impulsado por modelos lingüísticos cada vez más potentes y accesibles.