Metaは出版社ごと買い取りも検討か

生成AI訓練データの買収が激化。アップルも数億点の画像・動画ライセンスに莫大な支払か

Image:Adrian Tusar/Shutterstock.com

アップルが競合他社を後追いするように、独自の生成AI開発に乗り出したと報じられたのは昨年夏頃のこと。しかし、それ以前から同社はAI訓練用のデータ収集に乗り出していたと米Reutersが伝えている。

OpenAI等は当初、ウェブからデータをスクレイピング(大量の情報を自動的に抽出)してモデルを訓練していた。しかし、やがて著作権という法的な壁が立ちはだかる。

X(当時Twitter)は「極端なレベルのデータスクレイピングが行われている」としてポストの閲覧数を制限。さらに米New York Times(NYT)はOpenAIとマイクロソフトが巨額の投資にただ乗りしているとして提訴していた

そんななか、複数のハイテク大手が著作権のあるデータを使用すべく、ライセンス契約に多額の資金を注ぎ込んでいるという。

米大手法律事務所はReutersに対し、「現在、スクレイピングできないプライベートコレクションを持つ著作権者を探す依頼が殺到」しており、写真や映画、書籍のアーカイブをAI訓練用にライセンスを得るため、数千万ドル相当の契約を助言していると語っている。

その具体例の1つが、世界的なフォトストックサービスのShutterstockだ。2022年後半にChatGPTが公開されてから数か月のうちに複数の大企業が数億点の画像、動画、音楽ファイルを訓練に使う契約を結んだとのことで、その中にアップルの名前が挙がっている。

それぞれ契約額は2500万ドル~5000万ドルの範囲だったが、ほとんどは後に拡大されたという。ほかMetaやGoogle、アマゾンもShutterstockと同様の契約を結んでいるようだ。

また昨年末、アップルは主な報道機関や出版社と交渉を始め、自社の生成AI開発における資料の使用許可を求めているとの報道もあった

生成AI開発で競合他社に先んじつつ、訴訟リスクを避ける上で、訓練データの取得は日に日に重要度を増しているようだ。その一例として、Metaは米大手出版社Simon&Schusterの買収まで検討していると報じている。

iOS18は、iPhoneのユーザー体験を向上させるため、AIを活用した機能に重点を置くと予想されている。アップル幹部のグレッグ・ジョズウィアック氏は、米6月10日から開催予定のWWDC24につき「Absolutely Incredible!」とXにポストして、事実上「A」と「I」が主役になると示唆していた

関連キーワード: