AIにPCを触らせたいなら注目
OpenAI、年明けにも「コンピューターを操作可能なAI」をリリースするとの報
OpenAIは、新しいAIエージェント「Operator」を、年明けにもリサーチプレビュー版としてリリースする予定だと伝えられている。また開発者は、OperatorにAPI経由でアクセス可能になる利用可能になるという。
Bloombergの複数の匿名情報提供者によると、OperatorはAnthropic Claude 3.5の「Computer Use」のように、AIが自らマウスカーソルや画面上のUIを操作して、目的の処理をユーザーに代わってこなす機能であるという。このような自律的に動作するAIエージェント機能にはGoogleも取り組んでいることが伝えられている。
情報提供者は、完成に最も近いのはウェブブラウザー上で何らかのタスクを実行する汎用ツールだとしている。
OpenAIのサム・アルトマンCEOはReddit「Ask Me Anything」フォーラムに現れ、AIモデルは今後も進歩を続けるとしつつ、次の大きなブレークポイントはエージェントになると予想を述べていた。
先月行われた同社の開発者イベントDev Dayでも、OpenAIの最高製品責任者を務めるケビン・ワイル氏は「2025年はエージェントシステムがメインストリーム化する年になるだろう」と発言していた。
蛇足だが、OpenAIは10月にChatGPTのウェブ検索機能を開始している。ChatGPTのウェブ検索機能では、質問への応答に関連ソースとなるウェブページへのリンクが提供される。OpenAIは「以前は、検索エンジンにアクセスする必要があった」と述べ、ChatGPTにウェブ検索が追加されたことにより、ユーザーは「より自然な会話形式で」ウェブに関する検索ができるようになった。