生成AIベンチマーク比較サイトの多くで首位を獲得
Google Gemini 3発表。「最先端の推論とマルチモーダル機能」を搭載

Googleは、「最先端の推論により最も複雑なリクエストを解決できる」とうたう生成AIモデル最新バージョン「Gemini 3」を発表した。
テキスト生成AIとして、プロンプトへの回答がより簡潔に、実用的かつ整然としたものになったという。また、「世界中のどのモデルよりも優れ」ると自慢するマルチモーダル能力は、学習問題を撮影・アップロードしてサポートを求めたり、会議や講義の録音からメモを書き出すといった際に有効に作用するとGoogleは説明している。
また、推論能力とマルチモーダル能力の強化とともに導入された新機能「生成インターフェース」では、ユーザーからのプロンプトに対する回答を生成する際に、実験的機能である「ビジュアルレイアウト」と「動的ビュー」を駆使して、まるでウェブページのように見やすくレイアウトされた回答を返す。
ビジュアルレイアウトは画像や機能的UIを備え、雑誌のような没入感ある回答を表示するもの。たとえば、旅行プランを立てるよう指示すれば、ガイドブックのような体裁の回答が返されるといった具合だ。
Gemini 3では、Gemini Agentと称するエージェント機能が米国のGoogle AI Ultraユーザーから先行公開される。この機能は複数の手順を要するタスクを自動化し、Google アプリと連携してカレンダーやリマインダーへの記入管理やGmailの受信トレイ整理、タスクの優先順位を付け、メール返信の下書きまで自動作成が可能になるという。ただし、この機能は米国より提供開始されるが、日本での提供時期はまだ未定となっている。
Gemini 3はGoogle検索にも導入され、まず米国内での「AI モード」で利用可能になる。AIモード入力画面左上のメニューにある「AI Mode」タブのプルダウンメニューを「Default」から「Thinking」に切り替えることでGemini 3 Proが使えるようになる。
Gemini 3 Proは、その性能がGemini 2.5 Proから着実に向上しており、主要なAIベンチマークの多くでランキング首位に立つスコアを記録している。Google AI Ultraユーザーにまず提供される「Gemini 3 Deep Think」では、推論能力を大きく高めており、人が思考するように複雑な問題を段階的に分析、検証しつつ回答を導出できるとのことだ。
- Source: Google
