「ヘイSiri」の「ヘイ」をなくすだけで2年以上か

改良版Siriの遅れ、背景にアップル社内の混乱?WWDCでのデモも「架空」との報道

Image:PixieMe/Shutterstock.com

アップルは、音声アシスタントSiriの新機能のリリースを2026年に延期すると発表し、複数の識者から痛烈な批判を浴びせられていた。この開発遅延の背後には、社内の大きな混乱があったと、ニュースメディアThe Informationが詳細に報じている。

同社はApple Intelligenceのバックエンドとして、当初「Mini Mouse」(iPhoneのローカル実行用)と「Mighty Mouse」(クラウド実行用)と呼ばれる小型・大型の言語モデル(LLM)を構築する計画だった。しかし、Siriの開発リーダーは方針を変更し、クラウド経由ですべてのリクエストを処理する単一の大規模言語モデル(LLM)の構築を決定。さらに何度も方針転換が行われたことで、エンジニアの不満を招き、一部のスタッフの退職につながったという。

アップルの強固なプライバシー保護スタンスに加え、社内の対立する個性も問題に拍車をかけた。AIおよび機械学習(以下AI/ML)グループに属していた元従業員らは、実行面での問題の原因として貧弱なリーダーシップを挙げ、リラックスしすぎた社風や、将来のSiri設計におけるリスクを取る意欲の欠如も指摘している。

このAI/MLグループは社内で「AIMLess」(あてもなくさ迷う)、改良版Siriは「hot potato」(厄介な問題)と呼ばれ、異なるチーム間でたらい回しにされたが、目立った改善は見られないという。AIグループ内でも、給与、昇進、休暇、勤務時間の長短をめぐって対立があったとのことだ。

AI部門のトップであるジョン・ジャナンドレア氏は、適切な訓練データと一般的な質問に対するより良いウェブスクレイピングによりSiriを修正できると確信していたようだ。2022年にChatGPTが登場した際にも、上層部のリーダーらは危機感を持って対応せず、ジャナンドレア氏もChatGPTのようなチャットボットがユーザーに大きな価値をもたらすと信じていないと従業員に伝えていたという。

2023年、アップルのマネージャーはエンジニアに対し、最終的なアップル製品に他社のモデルを組み込むことを禁止し、自社モデルとのベンチマークにのみ使用できると指示したが、アップルの自社モデルは「OpenAIの技術ほど性能が良くない」とのことだ。

Siriの開発リーダーであるロビー・ウォーカー氏は、Siriの応答待ち時間を短縮するなど「小さな勝利」に焦点を当てたという。その一つがSiriを起動する音声コマンドを「Hey Siri」から「Hey」を削除することで、これには2年以上かかった。また、エンジニアチームがSiriに感情的な感度を与え、苦痛を感じているユーザーを検知して適切な応答を提供するという試みも却下されたそうだ。

さらに驚きなのは、WWDC 2024でのApple Intelligenceのデモにまつわる証言だ。Siriがユーザーのメールにアクセスしてリアルタイムのフライトデータを見つけ、メッセージを使ってランチの予定をリマインドしたり、マップでルートを描くなどの印象的なデモは、事実上架空のものだったという。Siriチームのメンバーは、これらの機能の動作バージョンを見たことがなかったと伝えられている。実際にテスト端末で動いていた唯一の機能は、ディスプレイの端に表示されるApple Intelligenceのカラフルなリボンだけだったとのことだ。

一部のアップル社員は、クレイグ・フェデリギ氏(ソフトウェアエンジニアリング担当上級副社長)とマイク・ロックウェル氏(Siri改革担当リーダーの一人。Apple Vision Pro開発を主導した)がSiriを立て直せると楽観視しているという。フェデリギ氏はSiriのエンジニアたちに、アップルの自社モデルではなく、他社のオープンソースモデルを使うことになったとしても、「最高のAI機能を作り上げるために必要なことは何でも行う」よう指示したとされている。

関連キーワード: