プロンプト制限でディープフェイク対策

Googleがテキストから音楽をAI生成する「MusicLM」を公開

Image:Google Play

5月11日、Googleは文章による説明を解釈して音楽を生成する実験的なAIツール「MusicLM」を公開。デスクトップブラウザーおよび、Android/iOS版の「AI Test Kitchen」アプリから利用できる。

MusicLMでは、ユーザーが生成したい楽曲をイメージするための説明文を入力するだけで、AIシステムが音楽を2バージョン生成して提示する。より満足したバージョンの方にユーザーが “いいね” を付けることで、GoogleはそれをAIのパフォーマンス向上に役立てられる、という仕組みだ。なお楽曲は両方ともダウンロードして保存できる。

また、ユーザーは「エレクトロニック」や「クラシック」などといった言葉を指定することで、楽器や目指す雰囲気、ムード、感情を指定し、生成される作品をイメージに近づけることができる。

ただし、MusicLMはまだまだ学習が足りていないようで、出力される楽曲は良くて及第点、多くは素人がDAWを触っていたら “音楽みたいなものができた” というレベルのものが多い。たとえば、最初はうまく行っているように聴こえていても、どこかで何かが壊れ、イメージとして提示したテキストと方向性がずれていってしまうことが多い。

それでもまだ、たとえばOpenAIの音楽生成モデルJukeboxに比べれば、音楽としての体をなした出力が得られるようだ。TechCrunchは「この数ヵ月間、Googleはミュージシャンと協力し、ワークショップを開催してこの技術がいかに創造的なプロセスを後押しできるかを確認してきた」と伝えている。

その成果のひとつとして挙げられるのは、MusicLMで出力した楽曲が、学習に使用した特定のアーティスト(ヴォーカル)の声が入った楽曲を生成しないようになっているところだ。アーティストのボーカルや演奏をAIに学習させ、そのアーティストそっくりに異なる楽曲を演奏させる技術は、人々を驚かせはするものの、著作権やその他の問題が議論されている。

2020年にはラッパーのJay-Zが、YouTubeチャンネル「Vocal Synthesis」に対し、勝手にビリー・ジョエルの「ハートにファイア(We Didn’t Start the Fire)」を自身の声のAIでカバーさせたとして著作権侵害を申し立てていた。また本記事の執筆時点でも、フレディ・マーキュリーのAI音声でビートルズの「Yesterday」やエルトン・ジョンの「I’m Still Standing」をカバーしたバージョンがYouTubeに公開されて話題となっているが、これが著作権などの権利関係をクリアしているかは不明だ。ディープフェイク音楽は法的根拠が曖昧であり、今後解決されるべき問題がまだまだ残されている。

一方でMusicLMは、入力するプロンプトに制限を設けることにより、アーティストやボーカルをフィーチャーした音楽、特定のミュージシャンの特徴的なスタイルを持つ音楽が生成されないようにしており、ディープフェイクとして扱われる可能性は低そうだ。

関連キーワード: