OpenAI pourrait être contrainte de supprimer complètement son chatbot ChatGPT et de recommencer à zéro, selon un nouveau rapport de NPR (via Ars Technica). Cette suppression pourrait être effectuée dans le cadre d’une éventuelle action en justice qui pourrait également entraîner une amende pouvant aller jusqu’à 150 000 $ pour chaque matériel protégé par des droits d’auteur utilisé pour former le modèle de langage.
Le ChatGPT a suscité beaucoup d’attention au cours des derniers mois, notamment car les utilisateurs ont trouvé diverses façons d’utiliser l’outil de génération d’IA. L’un de nos propres collaborateurs, Chris Smith, a même utilisé le ChatGPT pour s’entraîner à un semi-marathon, et nous voyons maintenant son utilisation pour créer des critiques générées par l’IA. Cependant, le succès du modèle de langage sous-jacent à l’IA générative aurait pu avoir un coût très élevé.
Vous voyez, des modèles de langage comme le GPT-3.5 et le GPT-4 – qui font fonctionner le ChatGPT – sont formés à partir de données tierces. Et OpenAI a même créé un bot de web scraping qui peut extraire des informations des sites web pour former le modèle GPT. Le problème ici, cependant, est que OpenAI ne se contente pas d’utiliser des matériaux disponibles gratuitement et non protégés par des droits d’auteur. Elle utilise également des matériaux protégés par des droits d’auteur pour former ses modèles d’IA, et ce, sans autorisation.
Selon un nouveau rapport d’Ashley Belanger d’Ars Technica, le New York Times envisage actuellement la possibilité de poursuivre en justice OpenAI après avoir mis à jour ses conditions de service pour interdire à l’IA de collecter ses articles et images pour former des modèles de langage. La nature exacte des conséquences légales potentielles pour OpenAI n’est pas claire, mais des experts ont déclaré à Ars que cela pourrait entraîner qu’OpenAI doive payer jusqu’à 150 000 $ par contenu en infraction.
De plus, le procès pourrait contraindre OpenAI à supprimer complètement le ChatGPT et à recommencer depuis le début la formation de son modèle de langage, ce qui invaliderait essentiellement tout le travail que l’entreprise a accompli sur le modèle jusqu’à présent. Ce n’est pas la première fois que nous voyons OpenAI confrontée à des poursuites judiciaires. Des auteurs bien connus, tels que Sarah Silverman, se sont unis pour poursuivre l’entreprise pour des préoccupations similaires, tous cherchant à protéger les droits d’auteur du matériel qu’ils ont créé.
C’est une situation vraiment complexe. Si OpenAI était poursuivie par le New York Times, d’autres entreprises et sites pourraient prendre des mesures similaires pour protéger leur travail. Il est également possible, comme le note NPR, que le NYT et OpenAI parviennent à un certain accord de licence, permettant à l’entreprise de payer le NYT pour accéder à son contenu, qui serait alors légalement disponible pour former leur modèle GPT.
Si le Times poursuit son action en justice ou si OpenAI devra supprimer le ChatGPT reste à voir. Cependant, cela continue de renforcer la critique selon laquelle ces modèles de langage semblent toujours dépendre fortement du travail déjà réalisé par d’autres, ce qui est l’une des raisons pour lesquelles de nombreuses personnes ont des problèmes avec eux.