SDXL 1.0ももうすぐ

AI生成画像の「多すぎる指」も改善、Stable Diffusion XL 0.9発表

Image:Stability AI (Left – SDXL Beta, Right – SDXL 0.9)

Stability AIは、テキスト記述によって画像を生成するAI画像生成モデルの次期バージョン、Stable Diffusion XL(SDXL) 0.9を発表した。Stability AIのウェブツールClipdrop、Stability AI API、DreamStudio画像生成アプリで6月26日から利用可能になる。

このバージョンでは、「前バージョンよりも画像と構図のディテールが大幅に向上」しているとStability AIは説明。これまでの画像生成AIに見られた、手の指の数が明らかに増殖してしまう問題も改善されているという。

サンプルとして公開された画像では、4月に公開されたStable Diffusion XLベータ版と最新のSDXL 0.9で生成したエイリアン、オオカミ、コーヒーカップを持つ人物を出力して比較しており、SDXL 0.9のほうがディテールの細かさや手指の表現に説得力を増していることが示されている。

Image:Stability AI (Left – SDXL Beta, Right – SDXL 0.9)

画像生成AIにとって、オブジェクトが細かく密集している部分の表現は難しいようで、以前は手の指の本数が多すぎる例がよく見られた。また共和党がAI生成した画像を使って民主党を批判した映像でも、バイデン大統領の歯が異常に多かったりして、不気味な印象を与えていた。

Stability AIは、「SDXL 0.9は、標準的な家庭用コンピュータで実行できるにもかかわらず、生成AIイメージの創造的な使用例において飛躍的な進歩をもたらしている」とし、さらにSDXL 0.9が「映画、テレビ、音楽、教育ビデオ向けに非常にリアルな画像を生成できるほか、デザインや産業用途向けにも進化し続けており、AI生成画像を現実世界で応用する最前線に立っている」と、このバージョンに対する自信を語っている。

過去のバージョンと最新バージョンの中身の違いについては、新しいモデルを学習させる際のパラメーター数を大幅に増やしたとのことだ。そのため、SDXL0.9をもしローカルで実行する場合は最低16GBのRAMを搭載するPCに、8GB以上のVRAMをもつグラフィックボード、具体的にはNVIDIA GeForce RTX 20xx以上を備えたWindows 10/11またはLinuxシステムを推奨するとした。

なお、すでにSDXL 1.0の準備も進んでおり、具体的な日程は未定だが7月中旬のリリースを予定しているとStability AIは述べている。

関連キーワード: