ギリギリまで秘密にしておいて一発逆転を狙う?

アップル、iOS 18に「生成AIベースのSiri」搭載か。オンデバイス&動画や音声も扱える可能性

Image:jittawit21/Shutterstock.com

アップル社内では独自AIチャットボット「Apple GPT」を開発していると噂され、ティム・クックCEOも生成系AI技術への投資を明らかにしていた

そうした生成AIを組み込んだSiriのリニューアル版が、次期「iOS 18」とともに今年のWWDC(世界開発者会議)で発表されると、英Financial Timesが複数のアナリスト報告に基づき主張している。

大手証券会社Wedbush所属のダニエル・アイブス氏は、アップルがAIスタートアップにつき「重要なM&A(合併・買収)を準備中」だという。なぜなら、AIの軍拡競争が起こっているなか、「外から見ているつもりはないから」とのことだ。

また大手金融モルガン・スタンレーのアナリストは、アップルは2つの点でChatGPTのようなシステムを凌駕することを目指していると語る。すなわち「オンデバイス処理」と「AIオーディオおよびビデオ」である。

まずオンデバイス処理とは、ChatGPTのように全ての処理をリモートサーバーで行うのではなく、iPhone等の端末内で完結させることだ。

これにはレスポンスの高速化とプライバシー保護のメリットがあるが、一方でモバイル機器の限られたメモリで大規模言語モデル(LLM)を実行することは大きな課題だ。それが、アップルが開発に時間を要している主な理由だと考えられる。

昨年秋に発売されたApple Watch Series 9では、初めてオフライン環境でもSiriが利用可能になった。これがオンデバイスAIに向けた第一歩というわけだ。また、スマートフォン上でもフラッシュメモリを活用してLLMを動かせるとの論文を発表していたこともある。

第2の「AIオーディオとビデオ」は、まさに言語処理に特化したChatGPTを乗り越えようとするものだ。実際アップルは米コロンビア大学と協力して、画像内にある形や場所を言葉で説明するAI「Ferret」を開発していると明かしていた

すでにiOSにはドア検知やライブ・キャプション(話された言葉をリアルタイムにテキスト変換)が実装されており、アップルが言語のほか動画や音声も処理できるマルチモーダルAIをめざす兆しはいくつもある。

アップルがiOS 18にLLMによりリニューアルしたSiriを搭載するとの見通しは、著名ジャーナリストほか複数の情報源が伝えてきたことだ。競合するサムスンもGalaxy S24シリーズで「Galaxy AI」を打ち出したこともあり、次期iPhoneもAIの分野で後れを取るわけにはいかないだろう。

関連キーワード: