ただしGoogle One AIプレミアム加入者のみ
Gemini Live、まもなく「スマホ画面やカメラ映像にリアルタイムで応答」が可能に

Googleは開催中のMWC 2025にて、約1年前に予告していたGemini Liveの新機能がまもなく利用可能になると発表した。ユーザーがスマートフォンのカメラを通じたリアルタイムの映像をGeminiと共有できる「ライブビデオ」と、スマートフォン画面をシェアできる「スクリーンシェア」の2つである。
よりかみ砕いていえば、Geminiはユーザーと同じ世界やスマホ画面を見ることが可能となる。前者では、カメラに映ったオブジェクトや状況について質問に答えたり、アドバイスを提供できる。そして後者では、表示中の画面を理解し、それに関する質問に答えたり、操作をナビゲーションできるようになる。
Google Geminiは、テキストや画像、その他様々な種類の文書を処理できるマルチモーダルAIである。だが、動画に理解・対応する能力は限られており、YouTube動画を要約できることもあれば、できないこともある。ともあれ、その限界は取り払われつつあるようだ。
これらの機能は3月後半に、Android用Geminiアプリ向けに提供される予定だ。ただしGemini Advancedの一部となるため、有料プラン「Google One AIプレミアム」(月額2900円)の加入者のみが利用可能となる。
昨年のGoogle I/Oでは、AIとのより自然なやり取りを実演する「Project Astra」のデモが話題を呼んでいた。ユーザーが部屋の中でスマホを振り回すと、Gemini Liveがリアルタイムで質問に答えるというものだ。PC画面上のコード、スピーカーの仕組み、ホワイトボード上のネットワーク図を説明したばかりか、ユーザーが眼鏡をどこに置いたかを覚えていた。
リアルタイムの動画処理は高い計算能力を要するため、AIプレミアム料金だけで賄いきれるとも思えず、おそらくGoogleにさらなる損失をもたらすだろう。とはいえ、日々の生活に役立つ本機能は、Geminiユーザーを増やす可能性がある。
まだGeminiの月間アクティブユーザー数は約4200万人(2024年10月時点)に留まっており、OpenAIのChatGPTの約3億5000万人(6月時点)よりもケタ違いに少ない。今後Googleは、赤字覚悟でGeminiの機能を充実させていきそうだ。
- Source: Ars Technica