ライセンス取得せず大量の画像を使用した疑い

AI学習に画像を無断使用。画像生成AI「Stable Diffusion」をGetty Imagesが提訴

Image:Tobias Steinert/Shutterstock.com

最近は「Dall・E」「Midjourney」「Stable Diffusion」など、さまざまなAI画像生成ツールが話題になっている。画像生成用のテキスト文(「呪文」という呼称も広まりつつあるようだ)を入力するだけで、あたかもプロのアーティストが描いたかのようなアートワークを生み出せるようになった。

一方で、その画像生成AIを鍛えるためには膨大な量の画像を読み込み、学習させる必要がある。AI開発者らはその画像を、インターネット上から著作者に無断でかき集め、データセットとして使用したことから、アーティストの間では議論や抗議の声がわき起こり、一部では訴訟に発展するケースも出始めている。

ストックフォトサイトのGetty Imagesは、こうした動きに対し昨年9月に、自社サービスへのAI生成画像の登録を禁止した。そして今週、Gettyは著作権で保護された数百万の画像と、同社が所有または代理する関連メタデータをライセンスなしで不法にコピーし、AIで処理したとして、人気AI画像生成ツールのStable Diffusionを開発するStability AIを相手に訴訟を起こした。

訴状によると、Gettyは「個人および知的財産権を尊重するため、人工知能システムを訓練する目的に対して主要な研究者にライセンスを提供している」としつつ、「Stability AIは、Getty Imagesにそのようなライセンスの取得を求めず、代わりに独立した商業的利益を追求するため、行使可能なライセンスオプションと長年にわたる法的保護を無視することを選んだと考える」としている。

訴状内容の詳細は公開されていないものの、GettyのCraig Peters CEOは、訴えには著作権や画像をかき集める「スクレイピング」といったサービス利用規約への違反行為が含まれるとのこと。ただ、訴訟は金銭的な解決を求めるものではなく、今後同様の訴訟を起こさざるを得なくなったときのために、きちんとした(正規のサービスに有利な)判例を残すことが目的だと説明している。

Stable Diffusionは、Stability AIが資金を投じ、ドイツの非営利団体LAIONによって収集された大規模な画像データセットを使ってトレーニングされている。画像収集には、Common Crawlと呼ばれるウェブクローラーが使われており、毎月数十億のWeb ページをスクレイピングして画像の収集を行っているという。昨年8月に発表されたある調査では、Stability AIが使用したとされる画像の一部の収集元が明らかにされており、そのなかにはもちろんGetty Imagesも含まれていた。

ちなみに過去の事例としては、画像生成AIではないものの、AI顔認識システムを開発するClearview AIなどが、SNSなどから利用規約に反して大量の顔写真を収集したことで裁判を起こされ、罰金を科せられている

関連キーワード: