Selon Sam Altman, les créateurs de contenu qui contribuent aux capacités d’un modèle d’IA en bénéficieront à l’avenir. Comment exactement, cela n’est pas encore clair.

Lors d’un sommet sur l’IA à la Maison Blanche, le PDG d’OpenAI, Sam Altman, a déclaré que sa société travaillait sur des modèles d’IA respectant les droits d’auteur. L’objectif, a-t-il déclaré, est que les créateurs de contenu soient rémunérés lorsque leur contenu, ou dans le cas des images, leur style, est utilisé. Les détails techniques ne sont pas encore connus.

Lorsque OpenAI a introduit les plugins ChatGPT, elle a montré une compréhension de l’impact potentiel d’un grand modèle de langage avec des outils dans l’écosystème de contenu. Plus il y aura d’interactions dans l’écosystème des chatbots, moins d’attention – et donc moins d’argent – les créateurs de contenu recevront pour leurs produits en dehors du chatbot.

« Nous apprécions que ceci soit une nouvelle manière d’interagir avec le web et nous accueillons les retours d’information sur d’autres moyens de renvoyer le trafic vers les sources et de contribuer à la santé générale de l’écosystème », écrit OpenAI.

Les options possibles pour la génération de texte pourraient être une solution de streaming similaire à Spotify, basée sur les jetons utilisés si la génération peut être attribuée de manière exclusive aux sources, ou un tarif fixe basé sur la quantité de données fournies à OpenAI. Actuellement, les sites peuvent techniquement indiquer s’ils souhaitent être ou non suivis par ChatGPT, similaire à l’indexation de Google.

Modèles IA et droits d’auteur – c’est compliqué

L’utilisation d’images et de texte pour entraîner de grands modèles IA sans le consentement explicite est déjà controversée du point de vue des droits d’auteur. De plus, les modèles IA génératifs sont capables de produire du texte ou des images très similaires à l’original. Des poursuites judiciaires internationales sont en cours. L’une des plus importantes est celle de Getty Images contre Stability AI (Stable Diffusion).

OpenAI et d’autres entreprises d’IA pourraient aborder cette question en n’utilisant que des données pour entraîner de grands modèles IA lorsque cela est clairement autorisé. La question est de savoir si il est économiquement viable de collecter la quantité de données nécessaire avec la permission.

Alors que les modèles de langage pré-entraînés sont relativement statiques et ne sont actuellement mis à jour que tous les quelques mois, voire années, ChatGPT, par exemple, peut utiliser un plugin de navigateur pour ingérer des informations du web en temps réel et les combiner avec les connaissances des données d’entraînement. Cette capacité en temps réel des grands modèles de langage avec des outils (plugins) porte le débat sur les droits d’auteur à un nouveau niveau.

Le chatbot de Bing de Microsoft fonctionne de manière similaire. Le PDG de Microsoft, Satya Nadella, a promis aux éditeurs que le trafic sortant du chatbot serait défini comme un facteur de succès pour le produit et que les éditeurs partageraient son succès.

Il n’est toujours pas clair comment et si cela fonctionnera. Même si les chatbots peuvent citer des sources, il est probable que le nombre de visites sur le site à l’ère du chatbot diminuera considérablement à mesure que de plus en plus de tâches web seront effectuées via une interface de chatbot.