最新のモデルが出たときは必ず「これまでで最も高性能」

OpenAI、最新推論モデル「o3-pro」を発表

Munenori Taniguchi

Image:Dennis Diatel/Shutterstock.com

OpenAIは6月10日、4月にAIモデルo3およびo4-miniを発表した際に予告していた、o3-proなる最新推論モデルを発表した。

推論モデルは通常のAIモデルとは異なり、問題を段階的に解決していく。そのため、数学や物理などの問題、コーディングといったタスクにおいてより信頼性の高いパフォーマンスを発揮する。OpenAIは「速度よりも信頼性を重要視し、数分間を待つ価値があるような難しい質問への回答を求める場合は、こちらをおすすめする」と説明し、o3-proのレビューではレビュアーらが「テストを実施したすべてのカテゴリ、特に科学、教育、プログラミング、ビジネス、ライティングヘルプのような主要な分野で、o3よりもo3-proを一貫して好む」結果が出たと述べた。

また、O3-proはツールを利用できるため、ウェブ検索、ファイル分析、視覚的入力の推論、Pythonでのコーディング、記憶を活用した応答のパーソナライズなどができる。とはいえ、o3-proの処理速度は通常、o1-proよりも遅くなっていることも、OpenAIは明らかにした。

とはいえ、OpenAIは同社の社内テストでは、o3-proは一般的なAIベンチマークで優れたスコアを記録したと述べている。またAIモデルの数学スキルを評価するAIME 2024では、Google Gemini 2.5 Proよりも高成績を収め、博士レベルの科学知識を測るGPQA Diamondなるテストにおいても、AnthropicのClaude 4 Opusを上回ったと主張している。

なお記事執筆時点では、ChatGPTからのo3-proの利用はまだ「技術的な問題」が解決されておらず、無効化している。したがってOpenAIのAIを利用するCanvasにも対応していない。またo3-proは画像生成機能をサポートしていない。

これまで推論モデルとして提供されてきたo1-proを代替するモデルになるo3-proは、発表と同時にChatGPT ProとChatGPT Teamユーザーを対象に提供を開始、来週にはChatGPT EnterpriseおよびChatGPT Eduユーザーにも展開する。

OpenAIのサム・アルトマンCEOは、o3-proについて「本当に賢い!o3と比較した結果を初めて見たときは信じられなかった」とXへの投稿でやや大げさに述べている。

関連キーワード: