OpenAI, Google y Microsoft se reúnen con principales editoriales para discutir el periodismo en la era de la IA generativa. El mayor desafío es el derecho de autor.
Las principales empresas tecnológicas están conversando con grandes editoriales sobre el uso de contenido periodístico para entrenar modelos de IA y utilizar el contenido en chatbots. Empresas como News Corp, Axel Springer, The New York Times y The Guardian, por ejemplo, habrían mantenido conversaciones con al menos una de las principales empresas de IA.
Se dice que las empresas tecnológicas están dispuestas a pagar millones y están interesadas en relaciones a largo plazo. Además, algunas empresas tecnológicas están en negociaciones sobre cómo las editoriales pueden utilizar la IA para aumentar sus ingresos.
Negociaciones en etapa inicial
Las negociaciones se encuentran en etapa inicial. Se está discutiendo una especie de suscripción de contenido de las empresas de IA para las editoriales, las cuales tendrían permiso para utilizar el contenido en su tecnología.
Las estimaciones actuales para el uso de contenido periodístico sujeto a derechos de autor en el entrenamiento de IA varían de 5 a 20 millones de dólares al año. Financial Times también está involucrado en las negociaciones y ha informado al respecto.
Según Financial Times, el CEO de Axel Springer, Mathias Döpfner, está proponiendo un modelo cuantitativo similar al streaming de música. Sin embargo, esto requeriría que las empresas de IA sean transparentes sobre el contenido utilizado para entrenar sus modelos. OpenAI, por ejemplo, no revela los datos de entrenamiento para GPT-4, citando el entorno competitivo.
Döpfner ve una suscripción anual como una segunda opción, ya que esto pondría en desventaja a los proveedores de noticias más pequeños y regionales. Él defiende una solución colaborativa para toda la industria.
«Si no hay incentivo para crear propiedad intelectual, no habrá nada que rastrear. Y la inteligencia artificial se convertirá en una estupidez artificial», dijo Döpfner.
Se dice que Google ha acordado licenciar contenido periodístico para el entrenamiento de IA y ha presentado un modelo a The Guardian y NewsUK. Google confirma las negociaciones, pero no comenta sobre el contenido. La empresa está conversando con editoriales de noticias en Estados Unidos, Reino Unido y Europa, y ya ha entrenado a la IA con contenido disponible públicamente, incluido el de las editoriales. Otra opción es dar a las editoriales más control sobre el uso de su propio contenido, por ejemplo, ofreciendo una opción de exclusión voluntaria.
Se dice que el CEO de OpenAI, Sam Altman, ha conversado con News Corp y The New York Times. Al presentar ChatGPT con acceso a internet, OpenAI reconoció que esta es una «nueva forma» de interactuar con internet. La empresa afirmó que espera sugerencias sobre cómo dirigir el tráfico de regreso a sus fuentes y contribuir a la salud del ecosistema.
Los chatbots de IA socavan los ecosistemas de contenido establecidos
Existen dos problemas relacionados con los derechos de autor en el contexto de la inteligencia artificial y la publicación. Primero, el contenido periodístico forma parte de los datos de entrenamiento. Segundo, los chatbots conectados a internet acceden al contenido periodístico en tiempo real y lo utilizan como modelo para generar respuestas, como un resumen breve.
El problema es que el creador del contenido original, es decir, el editor, no recibe nada. Los usuarios del chatbot no generan ingresos porque no acceden al sitio web. En el peor de los casos, el chatbot ni siquiera cita correctamente la fuente. La identidad de la marca se pierde.
Además de los editores, este desarrollo afecta en general a todos los proveedores de contenido. Incluso el contenido de video y podcasts de servicios como YouTube o Spotify puede terminar siendo utilizado por los chatbots en forma de resúmenes de texto cortos, extractos de audio o videos acortados. Las noticias, análisis y contenido instructivo probablemente serán los más afectados.