OpenAI, Google et Microsoft rencontrent des éditeurs de premier plan pour discuter du journalisme à l’ère de l’IA générative. Le plus grand défi est celui des droits d’auteur.
Les grandes entreprises technologiques discutent avec les principaux éditeurs de l’utilisation de contenus journalistiques pour former des modèles d’IA et utiliser ces contenus dans des chatbots. News Corp, Axel Springer, le New York Times et The Guardian, par exemple, auraient entamé des pourparlers avec au moins l’une des principales sociétés d’IA.
Les entreprises technologiques seraient prêtes à payer des millions et sont intéressées par des relations à long terme. En outre, certaines entreprises technologiques discutent de la manière dont les éditeurs peuvent utiliser l’IA pour augmenter leurs revenus.
Des négociations qui n’en sont qu’à leurs débuts
Les négociations n’en sont qu’à leur début. Il est question d’une sorte d’abonnement au contenu par les sociétés d’IA aux éditeurs, qui seraient à leur tour autorisés à utiliser le contenu dans leur technologie.
Les estimations actuelles concernant l’utilisation de contenus journalistiques conformes aux droits d’auteur dans la formation à l’IA varient entre 5 et 20 millions de dollars par an. Le Financial Times participe également aux négociations et en rend compte.
Selon le Financial Times, Mathias Döpfner, PDG d’Axel Springer, propose un modèle quantitatif similaire au streaming musical. Toutefois, cela exigerait des entreprises d’IA qu’elles soient transparentes quant au contenu utilisé pour entraîner leurs modèles. OpenAI, par exemple, ne publie pas les données d’entraînement de GPT-4, invoquant l’environnement concurrentiel.
M. Döpfner considère qu’un abonnement annuel est une deuxième option, car cela désavantagerait les fournisseurs d’informations régionaux et de petite taille. Il plaide en faveur d’une solution collaborative à l’échelle du secteur.
« S’il n’y a pas d’incitation à créer de la propriété intellectuelle, il n’y aura rien à suivre. Et l’intelligence artificielle deviendra une stupidité artificielle », a déclaré M. Döpfner.
Google aurait accepté d’accorder des licences sur le contenu journalistique pour la formation à l’intelligence artificielle et a présenté un modèle au Guardian et à NewsUK. Google confirme les pourparlers, mais ne veut pas commenter le contenu. La société discute avec des éditeurs de presse aux États-Unis, au Royaume-Uni et en Europe, et a déjà entraîné l’IA sur des contenus accessibles au public, y compris ceux des éditeurs. Une autre option consiste à donner aux éditeurs plus de contrôle sur l’utilisation de leur propre contenu, par exemple en proposant une option de retrait volontaire.
Le PDG d’OpenAI, Sam Altman, serait en pourparlers avec News Corp et le New York Times. En introduisant ChatGPT avec accès à l’internet, OpenAI a reconnu qu’il s’agissait d’une « nouvelle façon » d’interagir avec l’internet. L’entreprise a déclaré qu’elle attendait avec impatience des suggestions sur la manière de renvoyer le trafic vers ses sources et de contribuer à la santé de l’écosystème.
Les chatbots d’IA sapent les écosystèmes de contenu établis
L’intelligence artificielle et l’édition soulèvent deux questions liées au droit d’auteur. Premièrement, le contenu journalistique fait partie des données d’apprentissage. Deuxièmement, les chatbots connectés à l’internet accèdent au contenu journalistique en temps réel et l’utilisent comme modèle pour générer des réponses, telles qu’un bref résumé.
Le problème est que le créateur du contenu original, c’est-à-dire l’éditeur, ne reçoit rien. Les utilisateurs du chatbot ne génèrent pas de revenus car ils n’accèdent pas au site web. Dans le pire des cas, le chatbot ne cite même pas correctement la source. L’identité de la marque est perdue.
Outre les éditeurs, cette évolution affecte largement tous les fournisseurs de contenu. Même les contenus vidéo et les podcasts de services tels que YouTube ou Spotify peuvent finir par être utilisés par les chatbots sous la forme de courts résumés textuels, d’extraits audio ou de vidéos raccourcies. Les actualités, les analyses et les contenus pédagogiques seront probablement les plus touchés.