iPhoneやMacでどのように動くのか?
実機でわかった「新しいSiri AI」の速さ、賢さ。そのパフォーマンスを体験した
アップルは世界開発者会議「WWDC 26」で、Apple Intelligenceの各機能と連携する新しいパーソナルアシスタントの「Siri AI」を発表した。
筆者は現地でイベントを取材しながら、実際にiPhoneやMacでSiri AIがどのように動くのか、いくつかの主要機能のデモンストレーションを体験した。

より賢く、便利になるアップルのパーソナルアシスタントは、ユーザー個人の文脈(パーソナルコンテキスト)を理解して答えを返したり、端末の画面に表示されている情報を認識する。そして相応しいリアクションを返したり、アップルのデバイスとプライベートクラウドコンピューティング(PCC)が連携しながら実現する。
なお、Siri AIは年内に、対応するデバイスを英語に設定しているユーザーにベータ版のサービスとして提供される予定だ。各言語対応も然り、今回の取材で写真に収めたデモンストレーションの内容と画面は、初期開発者向けベータソフトウェアを使って行っている。
したがって、機能の名称やユーザーインターフェースのデザインが正式ローンチ時には変更になる可能性があることをあらかじめ伝えておきたい。
デバイス内の情報を横断するパーソナルコンテキスト検索に対応
新しいSiri AIは、Googleとのコラボレーションにより最適化したApple Intelligenceの新しいモデルを基盤としつつ、応答精度に加えてスピードも重視しながら基礎からアーキテクチャを作り直している。デモンストレーションを見る限りでは、リクエストを入力した後のレスポンスが驚くほどに速かった。
Siri AIの大きな特徴は、デバイスに保存されているメッセージ、写真、メール、Safariの検索履歴など、ユーザー個人のデータにアクセスして、文脈(パーソナルコンテキスト)に従った的確な回答を引き出せるところにある。
実機を使ったデモンストレーションでは、メッセージアプリで「姉が最近おすすめしていたポッドキャストは何?」とSiri AIに聞き、探し当てたコンテンツをそのままiPhoneで再生してみせた。

自分の兄姉を連絡先に「兄」「お姉ちゃん」という名前で登録する方もいることは、ここではさておくとして、Siri AIがユーザーのパーソナルコンテキストにアクセスできるようになると、ユーザーと他の人との関係性であったり、「最近おすすめしてくれた」という、比較的あいまいな日時の指示も適切に解釈しながら情報にラベル付けをして、ユーザーの期待値に近い情報を返してくる。
続けざまに「それを再生して」と、Siri AIに話しかけるとiPhone上でコンテンツの再生が始まった。間にもう一度ウェイクワードを発話する必要はない。

ほかにも友人から送られてきた「キャンプに必要な持ち物」に関するメールを開いてから、Siri AIを立ち上げて「メモ」アプリに持ち物のチェックリストを作るデモンストレーションも、目の当たりにすると実用性を実感した。


ビジュアルインテリジェンスが画面の表示内容を理解する
ユーザーが現在開いているデバイスの画面に表示されている情報をSiri AIが理解し、応えるべきタスクをユーザーに提示する、ビジュアルインテリジェンスを介した「オンスクリーン認識」の機能もMacBookの実機を使って紹介した。

Macではキーボード操作により「Command+Shift+Space」のショートカットからビジュアルインテリジェンスを呼び出せる。
メールアプリの画面上に表示されたPDF形式のスケジュール表をSiri AIが認識すると、「カレンダーに追加」を選ぶだけで、要件のタイトル・日時・場所などのイベント詳細を一瞬にして取り出し、Siri AIがユーザーのカレンダーに予定を登録してくれた。
クラウドにある最新の情報を参照する
macOS 27の環境では、SiriがOSのネイティブ機能とより深く結びつき、キーボードからの入力にもスムーズに対応する。
例えばSpotlight検索のテキストボックスに「家族と旅行に行くべきハワイの島を教えて」と入力すると、システムが自動的にSiriへの質問であると認識する。Siri AIは複雑な内容、あるいは最新の情報を含めるべき情報を検索する際には、クラウドにある「Broad World Knowledge」にアクセスして検索を行う。
今回、デモを見た限りでは検索を開始してから、答えが表示されるまでのレスポンスもまた特筆するべき速さだった。

検索が完了するとSiriのウインドウが開き、オアフ島、マウイ島などハワイの島々に関する情報や、おすすめのアクティビティが画像付きの比較表で提示された。これは参考になりそうだ。SiriのウィンドウはmacOSのデスクトップ上で自由に配置場所を変えたり、ウインドウの大きさも任意に決めたりできる。
さらに、旅行先の島のリストが表示された後から、「ウミガメを見るのに最適な島を教えて」といった具合に、フォローアップの質問をチャット形式で続けることもできる。

MacのSpotlightがSiri AIに連動する
ビジュアルインテリジェンスの機能がiPhone、iPadの純正「カメラ」アプリに統合されて、新設されるカメラの「Siriモード」に変わる。

この機能のデモでは、カメラをSiriモードで立ち上げてから、iPhoneのカメラを向けた植物について調べて、名前は観葉植物の「フィカス・オードリー」であり、育て方の情報も調べることができた。
他にもSiriモードのカメラでスキャンした本の表紙から関連情報を検索し、同じ作家の「ほかのおすすめの本」をSiri AIに聞いて、話題を深掘りしていく楽しみ方も紹介された。

筆者はスマホのカメラを被写体に向けてSiriに聞くよりも、スマートグラスやイヤホンに内蔵されているカメラの方が、もしも周囲に大勢の人がいる環境で行うのであれば違和感を感じさせないと思う。今回のカメラのSiriモードは、Apple Intelligenceのビジュアルインテリジェンスを、何か新しいデバイスで活用することを念頭に置いた進化なのかもしれない。
次期Apple Intelligenceのアーキテクチャーでは、Siriのインターフェース自体が独立したアプリとして機能し、過去のやり取りをタイムライン形式で保持・閲覧できるようになる。各OSに標準インストールされる「Siriアプリ」がそのコンタクトスポットになる。

例えば今回のデモンストレーションで、iPhoneを使って実践したポッドキャストの検索、Macで探したハワイへの家族旅行に関するSiriとの会話履歴は、エンドツーエンドの暗号化を用いて同期され、iPadでSiriアプリを開いて参照できる。デバイスを変えて、後からSiriとの会話を再開・継続することも可能だ。
パワフルなオンデバイスモデルのみ端末のスペックに制限がある
新しいSiri AIは、リクエストの内容に応じて動的に使用するモデルを切り替えるアーキテクチャを採用している。ディクテーション(聴き取り)や表現力豊かな音声モデルは、常にオンデバイスで処理される。
一方で、Broad World Knowledgeを用いる外部情報の検索やパーソナルコンテキストの複雑な処理には、AppleシリコンをベースとするPrivate Cloud Compute(PCC)を使う。いずれもユーザーのプライバシーを強固に守るセキュアなプラットフォームを整備した状態で、新しいSiri AIに関連するサービスを提供する。
Siri AIの機能の大部分は、iPhoneの場合はApple Intelligenceをサポートする「iPhone 15 Pro以降のモデル」で動作する。
ただし、最も強力なオンデバイス処理を必要とするディクテーション、およびSiriが流ちょうに話せる音声モデルを利用するためには、A19 Proチップを搭載する「iPhone 17 Pro」または「iPhone Air」以降のデバイスが求められる。
アップルが毎年秋以降に発売する次世代のiPhone、またはiPadにMacなどの新製品はより広く、パワフルなオンデバイスモデルが利用できるようになることを期待したい。
