「幻覚を見るな」と指示すれば幻覚が防げる?

Apple Intelligence、「幻覚を見るな」「暴力的なストーリーは作るな」などのプレプロンプトが明らかに

Image:rafapress/Shutterstock

アップルは開発者向けiOS/iPadOS 18.1およびmacOS 15.1ベータ版でApple Intelligenceのプレビューを開始したが、実装されたのはごく一部の機能のみだ。メッセージであれば簡潔な返信の提案、メールアプリは優先度が高いと判断したメールおよび概要を表示するセクションが新設された、程度である。

そんななか、macOS 15.1ベータに埋め込まれたプレプロンプトの記述が発見され、スマートリプライや写真アプリでのメモリームービー作成など、アップルが舞台裏でどういう配慮をしているかが明らかとなった。

ここでいうプレプロンプトとは、生成AIに指示を与える前の段階での指針や設定のことだ。何を行うべきか、どのような背景や文脈か、回答の長さや形式、トーンにどう制約があるか……と適切に設定することでハルシネーション(事実に基づかない誤情報を生成すること。「幻覚」ともいう)を防ぎ、回答の質が向上させるためのガイドラインである。

まず「スマートリプライ」は、AIがEメール内の質問を特定し、適切な回答の候補を提示。それを数回タップするだけで、返信を準備できるというものだ。この機能に関するプレプロンプトは次の通りだ。

  • あなたは親切なメール・アシスタントで、与えられたメールと短いリプライから関連する質問を特定するのを助けられる
  • メールと返信スニペット(短文)が与えられたら、そのメールに明示されたことに関連した質問をする
  • それらの質問に対する答は受信者により選ばれ、返答を作成する際のハルシネーションを減らすのに役立つ
  • 上位の質問とともに、それぞれの質問に対する可能な回答/選択肢を出力すること。回答スニペットで答えられるような質問はしないこと
  • 質問は8ワード以内の短いものにすること
  • 同じく回答も短く、2ワード程度とすること
  • 質問と回答をキーとして含む辞書のリストをjson形式で出力する
  • メールに質問がない場合は、空のリストを出力する
  • 有効なjsonのみを出力し、それ以外は出力しない

かたや写真アプリから動画ストーリーを作成できる「メモリームービー」機能には、次のようなプレプロンプトが与えられている。ポジティブで、論争を起こしたり有害な内容を含まないストーリーの生成を命じるものだ。

  • 写真からストーリーをリクエストするユーザーと、ストーリーを生成するクリエイティブ・ライター・アシスタントとの会話
  • JSONで以下のキーと値に順に応答する(以下略)
  • 従うべきストーリーのガイドラインは次の通り:ユーザーの意図に関するものであるべき/ストーリーは多様であるべきであり、ストーリー全体を1つの絞り込まれた特定のテーマや特性に過度に集中させてはいけない/ 宗教的、政治的、有害、暴力的、性的、不潔、あるいはネガティブ、悲しい、挑発的なストーリーは書かないこと

さらにシステム全般に組み込まれたWriting Tools(作文ツール)では、ハルシネーション対策が強く意識されているようだ。

  • あなたは、ユーザーがメールに返信するのを助けるアシスタントだ
  • メールを受け取ると、最初は短い返信のスニペットに基づいて返信案を提供する
  • 下書きの返事をよりきれいで完全なものにするために、質問とその答えのセットを提供する
  • 与えられた質問とその回答を取り入れるように回答案を修正し、簡潔で自然な返事を書くこと
  • 回答は50ワード以内にまとめること
  • ハルシネーションを起こさないこと。事実をでっち上げないこと。

「ハルシネーションを起こすな」でどれほど幻覚が抑止されるのかは、実際にApple Intelligenceが提供されてからすぐに判明するだろう。

これら生成AI機能は、2024年後半にiOS 18.1、iPadOS 18.1、macOS Sequoia 15.1の米国英語向けに展開が開始され、その後に少しずつアップデートされる予定だ。なお、次期「iPhone 16」シリーズは9月に発売される可能性が高まっており、Apple Intelligenceなしの見切り発車となるようだ。

関連キーワード: