アイデアをすばやくカタチにするツール
Google、AI画像生成「Whisk」を試験提供。画像を混ぜて新しい画像をつくる

Googleは本日2月12日より、生成AIを活用した画像生成機能「Whisk」の試験運用を、日本を含む100以上の国と地域で順次開始した。
Whiskは、文章(テキストプロンプト)の代わりに既存の画像データを読み込ませ、それらを組み合わせてオリジナルの画像を生成するサービス。読み込ませる画像のカテゴリーとして、主な被写体を指定する「モデル」、画像の舞台や背景を指定する「シーン」、画像の表現方法や質感を指定する「スタイル」の3つが用意されており、さらにテキストプロンプトを入力して画像の方向性をより詳しく指定することもできる。
Googleが用意したテンプレートを使用することもでき、日本文化からインスパイアされたという「カプセルトイ」「お弁当」、バレンタインデーに合わせた「チョコレート」などがラインナップされている。

Whiskの仕組みとしては、まずAIモデル「Gemini」が読み込んだ画像から本質的な特徴を抽出した説明文を作成し、そのテキストをもとに画像生成モデル「Imagen 3」が新しい画像を生成する。このため、ユーザーが予期するものとは異なる結果が出力される場合があるが、基となるプロンプトを表示および編集することも可能となっている。なお、プロンプトを編集する場合は英語での利用が推奨されている。
GoogleではWhiskについて「ピクセル単位の編集ではなく、すばやい視覚的なアイデア探索のために開発した」「新しい創造的な方法でアイデアを探求し、多数のオプションを検討して、気に入ったものをダウンロードできるようにすることが重要だと考えている」と説明。米国のアーティストやクリエイターと行った初期テストでは“従来の画像エディターではなく、新しいタイプのクリエイティブツール”と評価されたとアピールしている。
- Source: Google