OpenAIは、人気のある生成型AIツールであるChatGPTの背後にある企業であり、新しいNPRの報告(Ars Technica経由)によれば、完全にチャットボットを削除し、ゼロからやり直さなければならない可能性があります。このクリーンアップは、言語モデルをトレーニングするために著作権で保護された各資料に対して最大15万ドルの罰金が科される可能性のある、可能性のある訴訟の一環として発生するかもしれません。
ChatGPTは、特にユーザーがさまざまな方法でこの生成型AIツールを使用する方法を見つけたことから、最近数か月間でかなりの騒ぎを引き起こしています。当社の一員であるクリス・スミスも、ChatGPTを使用してハーフマラソンのトレーニングを行い、また今ではAIによって生成されたレビューを作成するためにその使用も見ています。しかし、生成型AIの背後にある言語モデルの成功は非常に高い代償を払っているかもしれません。
GPT-3.5やGPT-4のような言語モデルは、第三者のデータを使用してトレーニングされます。OpenAIはさらに、情報を抽出するウェブスクレイピングボットを作成して、GPTモデルをトレーニングするためにウェブサイトから情報を抽出できるようにしています。しかし、問題はここにあります。OpenAIは単に無料で入手可能で著作権で保護されていない資料に依存しているだけではありません。彼らはまた、著作権で保護された資料を使用して自分たちのAIモデルをトレーニングしており、許可なくそれを行っています。
Ars TechnicaのAshley Belangerによる新しい報告によれば、New York Timesは現在、OpenAIに対して訴訟を起こす可能性について検討しています。これは、IAがその記事や画像をスクレイプして言語モデルをトレーニングすることを禁止するためにサービス条件を更新した後の出来事です。OpenAIに対する可能な法的な結果の正確な性質は明確ではありませんが、専門家はArsに対して、これによってOpenAIが違反コンテンツごとに最大15万ドル支払う可能性があると述べました。
さらに、訴訟はOpenAIに対して、ChatGPTを削除し、言語モデルのトレーニングを完全にゼロからやり直すことを求める可能性があります。これは、事実上、これまで会社がモデルに対して行ったすべての作業を無効にするものです。OpenAIが訴訟に巻き込まれるのは初めてではありません。有名な著者であるSarah Silvermanなどが、類似の懸念を理由に会社を訴えており、彼らは自分たちが作成したコンテンツの著作権を保護しようとしています。
これは本当に複雑な状況です。OpenAIがNew York Timesから訴訟を受けると、他の企業やウェブサイトも同様の措置を取る可能性があります。また、NPRが指摘しているように、NYTとOpenAIはライセンス契約の一種に合意する可能性もあります。これにより、OpenAIがNYTへのアクセス料金を支払い、それによってGPTモデルをトレーニングするためのアクセスが合法化されるかもしれません。
Timesが訴訟を進めるか、またOpenAIがChatGPTを削除する必要があるかはまだわかりません。ただし、これはこれらの言語モデルが常に他人がすでに行った作業に大きく依存しているように見えるという批判を続けており、多くの人々がこれらのモデルに問題を抱いている理由の1つです。