著作権者の権利を侵害しないフェアユースは認められにくそう

ChatGPT、学習データ破棄で“やり直し”になる可能性。米NYTが提訴検討か

Image:T. Schneider/Shutterstock.com

米The New York Times(以下、NYT)は今月初めサービス利用規約を更新し、テック企業がAIモデルを訓練するために記事や画像を無断でスクレイピングすることを禁止した。それから数週間後、NYTはOpenAIを提訴する準備を進めていると米NPR(公共ラジオ放送)が報じている。

数週間前からNYTとOpenAIは、NYTの記事をAIの学習に使う際にライセンス料を支払う契約の締結をめぐって緊迫した交渉を続けてきたとのこと。だが、協議があまりに紛糾したために、NYTは法的措置を検討しているという。

この訴訟が実現した場合、ChatGPTが爆発的な人気を博して以来、著作権保護をめぐる「最も注目される」法廷闘争になる可能性があるとNPRは指摘している。先月も、全米8,500人以上の作家が生成系AI大手に向けて「著作物の利用許可および補償」を求める公開書簡を発表したばかりだ。

なぜ、最も注目される可能性があるのか。それはChatGPTの基盤となるデータセットが破壊され、侵害コンテンツ1つにつき最高15万ドル(約2,180万円)の罰金を課されるなど、OpenAIにとって壊滅的な打撃となる恐れがあるからと専門家は述べている。

もしもOpenAIが敗訴した場合、連邦裁判事はChatGPTのデータセット破棄を命じられるとのこと。結果として同社は、使用を許可された著作物のみを使ってデータセットを再作成することを迫られる。それ以上にNYTの勝訴は、他のメディアや権利者からの同様の請求が殺到することさえ招きかねない。

その他のAI企業にとっても、無関係な話ではない。画像生成AIのStable Diffusionを提供するStability AIも、学習に画像を無断使用したとして、Getty Imagesに提訴されていた

OpenAIをはじめとしたAI大手各社は、AIモデルを訓練するため使った全てのウェブコンテンツにつき「フェアユース」を主張する必要があるだろう。NYTのケースで言えば、ChatGPTの回答を作成するためにNYTの記事や画像を使ってもNYTの権利を侵害しない、すなわちNYTの記事と競合しないことを証明しなければならない。

しかし専門家は、OpenAIにとってそれは困難なことだと述べている。

たとえば2013年、Googleの書籍全文検索サービス「Google Books」が何百万冊もの書籍をデジタルスキャンしたことはフェアユースだと認められたが、それは書籍の「重要な市場代替物」を生み出していない、つまり原著作と競合していないと判断されたからだ。同サービスでは、閲覧できるのは書籍の一部のみに限られ、全ての内容は読めない。

しかしChatGPTがNYTのウェブ記事を元にして回答を生成すれば、それはユーザーにとってはNYTのニュースとほぼ等価ということになる。それは元の著作物と「同一または極めて類似した目的」を共有していると見なされる可能性が高い、というわけだ。

ほか報道機関としては、AP通信がOpenAIとニュース記事につきライセンス契約を締結したと発表したが、その契約条件は明らかにされていない。ともあれ、今後のOpenAIの対応に注目したいところだ。

関連キーワード: