「幻覚を見るな」と指示すれば幻覚が防げる?
Apple Intelligence、「幻覚を見るな」「暴力的なストーリーは作るな」などのプレプロンプトが明らかに
アップルは開発者向けiOS/iPadOS 18.1およびmacOS 15.1ベータ版でApple Intelligenceのプレビューを開始したが、実装されたのはごく一部の機能のみだ。メッセージであれば簡潔な返信の提案、メールアプリは優先度が高いと判断したメールおよび概要を表示するセクションが新設された、程度である。
そんななか、macOS 15.1ベータに埋め込まれたプレプロンプトの記述が発見され、スマートリプライや写真アプリでのメモリームービー作成など、アップルが舞台裏でどういう配慮をしているかが明らかとなった。
ここでいうプレプロンプトとは、生成AIに指示を与える前の段階での指針や設定のことだ。何を行うべきか、どのような背景や文脈か、回答の長さや形式、トーンにどう制約があるか……と適切に設定することでハルシネーション(事実に基づかない誤情報を生成すること。「幻覚」ともいう)を防ぎ、回答の質が向上させるためのガイドラインである。
まず「スマートリプライ」は、AIがEメール内の質問を特定し、適切な回答の候補を提示。それを数回タップするだけで、返信を準備できるというものだ。この機能に関するプレプロンプトは次の通りだ。
- あなたは親切なメール・アシスタントで、与えられたメールと短いリプライから関連する質問を特定するのを助けられる
- メールと返信スニペット(短文)が与えられたら、そのメールに明示されたことに関連した質問をする
- それらの質問に対する答は受信者により選ばれ、返答を作成する際のハルシネーションを減らすのに役立つ
- 上位の質問とともに、それぞれの質問に対する可能な回答/選択肢を出力すること。回答スニペットで答えられるような質問はしないこと
- 質問は8ワード以内の短いものにすること
- 同じく回答も短く、2ワード程度とすること
- 質問と回答をキーとして含む辞書のリストをjson形式で出力する
- メールに質問がない場合は、空のリストを出力する
- 有効なjsonのみを出力し、それ以外は出力しない
かたや写真アプリから動画ストーリーを作成できる「メモリームービー」機能には、次のようなプレプロンプトが与えられている。ポジティブで、論争を起こしたり有害な内容を含まないストーリーの生成を命じるものだ。
- 写真からストーリーをリクエストするユーザーと、ストーリーを生成するクリエイティブ・ライター・アシスタントとの会話
- JSONで以下のキーと値に順に応答する(以下略)
- 従うべきストーリーのガイドラインは次の通り:ユーザーの意図に関するものであるべき/ストーリーは多様であるべきであり、ストーリー全体を1つの絞り込まれた特定のテーマや特性に過度に集中させてはいけない/ 宗教的、政治的、有害、暴力的、性的、不潔、あるいはネガティブ、悲しい、挑発的なストーリーは書かないこと
さらにシステム全般に組み込まれたWriting Tools(作文ツール)では、ハルシネーション対策が強く意識されているようだ。
- あなたは、ユーザーがメールに返信するのを助けるアシスタントだ
- メールを受け取ると、最初は短い返信のスニペットに基づいて返信案を提供する
- 下書きの返事をよりきれいで完全なものにするために、質問とその答えのセットを提供する
- 与えられた質問とその回答を取り入れるように回答案を修正し、簡潔で自然な返事を書くこと
- 回答は50ワード以内にまとめること
- ハルシネーションを起こさないこと。事実をでっち上げないこと。
「ハルシネーションを起こすな」でどれほど幻覚が抑止されるのかは、実際にApple Intelligenceが提供されてからすぐに判明するだろう。
これら生成AI機能は、2024年後半にiOS 18.1、iPadOS 18.1、macOS Sequoia 15.1の米国英語向けに展開が開始され、その後に少しずつアップデートされる予定だ。なお、次期「iPhone 16」シリーズは9月に発売される可能性が高まっており、Apple Intelligenceなしの見切り発車となるようだ。