ゲーム本編そっちのけでNPCと延々会話する未来が?

NVIDIA、ゲームのNPCと自然な会話ができる生成系AI技術「ACE」を発表

Image:NVIDIA

米NVIDIAは5月29日(台湾現地時間)、COMPUTEX 2023の基調講演にて、生成系AIによりゲームのNPC(ノンプレイヤーキャラクター)がプレイヤーと自然な会話ができる新技術「Avatar Cloud Engine(ACE)」を発表した。会話可能なNPCが作れるサービス「Convai」と協力して作成したというデモも、合わせて公開されている。

このKariosというデモは、プレイヤーが『サイバーパンク2077』風のラーメン屋でJinというNPCに音声で話しかけるというものだ。プレイヤーが「やあJin、元気かい?」と挨拶すると「残念だが、あまり良くはない」と返ってくる。「どうしてだ?」と尋ねると「この近所の犯罪が心配なんだ。最近酷くなってるんだよ、うちのラーメン屋も巻き込まれたし」と答え、自然に会話が繋がっている。

ChatGPTでの受け答えよりはぎこちなくも感じるが、ヘッドセットに向かって話しかければNPCが舞台設定に合った適切な文脈で、かつリアルタイムで回答することは新鮮にも思える。かつてのゲームでは数多くのフラグ(条件)を設定し、その数だけセリフのバリエーションを用意していたものもあったが、それより人間にかかる労力を確実に減らすものだろう。

このACEは、クラウドでもローカルでも動作し、3つの技術から構成されるという。まず「NVIDIA NeMo」は大規模言語モデル(LLM)の構築やカスタマイズ、実装を行うというもの。伝承やキャラクターのバックグラウンドを設定できるほか、不適切な会話を避けるガードレール機能もあるとのこと。

また自然な会話は自動音声認識と音声合成を行うツール「Riva」を用い、NPCの表情は「Omniverse Audio2Face」により実現する。任意の音声トラックに合わせて、ゲームキャラクターの表情豊かな顔アニメーションを瞬時に作成できるとのことだ。

今回のデモはUnreal Engine 5で作られているが、それはNVIDIAのGPUが持つレイトレーシングやその他の機能をアピールするためだろう。同社はChatGPTほかAIチャットボットの追い風を受けており、ハードウェアの売上げも後押しされて株価も跳ね上がっている。ジェンスン・ファンCEOが「AIがiPhoneになった(全世界の誰もが使うほど普及した)」と述べたのも、わが世の春を謳歌している感があった。

テキストを通じてAIと対話するチャットボットの衝撃もすさまじかったが、ゲームのようにビジュアルと音声を伴うとより説得力を増す。もっとも、そもそもゲームも「キーボードから逐一、テキストを入力」という煩雑さから「用意されたコマンドを選ぶだけ」(ドラクエ方式)に移ろった歴史もあり、ストーリー本編に深く関わらないNPCと音声で会話したり、そのためにGPUパワーや電力を消費するのも非現実的ではある。

実際NVIDIAは、ACEを採用するゲームを発表していない。が、今後の新作『Stalker 2: Heart of Chernobyl』と『Fort Solis』には、Omniverse Audio2Face搭載が予定されている。NPCと1人ずつ会話を楽しむかどうかはさておき、AIがゲームを進化させていくことは間違いなさそうだ。

関連キーワード: