ソフトウェア

OpenAI o3を「より長く考え正確に答える」ように強化したモデル「o3-Pro」がリリースされる


OpenAIが推論モデル・o3の強化版である「o3-pro」を、2025年6月11日に公開しました。o3ベースでありながら、より長く思考して回答の正確性を重視する設計となっています。

Model Release Notes | OpenAI Help Center
https://help.openai.com/en/articles/9624314-model-release-notes

OpenAI releases o3-pro, a souped-up version of its o3 AI reasoning model | TechCrunch
https://techcrunch.com/2025/06/10/openai-releases-o3-pro-a-souped-up-version-of-its-o3-ai-reasoning-model/

o3は2025年4月にOpenAIが発表したAIモデルで、数学やコーディング、推論、科学、視覚理解能力を測定するベンチマークで従来モデルを上回る性能を発揮したことから、「OpenAI史上最も高度な推論モデル」とされています。

OpenAIが「自社史上最も高度な推論モデル」と評価する「o3」と「o4-mini」を発表、テキストと同様に画像も使って考える「Thinking with images」が可能 - GIGAZINE


o3-proはo3をベースとしたモデルで、ウェブ検索やファイルの分析、視覚的な入力の推論、Pythonの使用、メモリを使用した応答のパーソナライズなどが可能。速度よりも信頼性を重視しており、「より長く推論を行い、信頼性の高い答えを出力する」ように設計されているとのこと。そのため、応答の完了には前世代のo1-proよりも時間がかかるそうですが、「その数分を待つ価値がある難問に使用することをお勧めします」とOpenAIは述べています。

専門家による評価では、テストされたすべてのカテゴリー、特に科学、教育、プログラミング、ビジネス、ライティング支援といった主要分野において、o3-proがo3よりも一貫して高く評価されています。また、o3-proは、明瞭性、包括性、指示の遵守、正確性においても一貫して高い評価を得ているとのこと。


また、OpenAIは数学・科学・コーディングのベンチマークで、o3-proがo1-proとo3の両方を一貫して上回っていることが示されたと報告しています。


また、より厳密に信頼性を評価するため、「4回の試行を行ってすべての質問に正しく答えた場合のみ正答したと評価する」という方法でチェックを行った結果が以下。数学・科学・コーディングのいずれにおいてもo3-proが最も高い成績をマークしました。


o3-proはChatGPT ProおよびTeamユーザー向けに、従来のo1-proを置き換える形で提供されます。EnterpriseおよびEduユーザーにはその翌週から提供が始まるとのこと。開発者向けのAPIは入力トークン100万当たり20ドル(約2800円)、出力トークン100万当たり80ドル(約1万1200円)です。


ただし、記事作成時点ではOpenAIは「技術的な問題の解決に当たっている」として、ChatGPT内でのo3-proとの一時的なチャットは無効になっています。また、o3-proは画像を生成できず、OpenAIのAIを活用したワークスペース機能であるCanvasはo3-proではサポートされていません。

この記事のタイトルとURLをコピーする

・関連記事
OpenAI o3でポケモンをプレイする生配信 - GIGAZINE

ChatGPTがチェス対決で「Atari 2600」に負ける - GIGAZINE

AppleがOpenAI「o3」のようなトップレベルのAIモデルや大規模推論モデルの限界を詳しく説明 - GIGAZINE

OpenAIが削除された会話を含むすべてのChatGPTログを保存するよう命じた裁判所命令を非難 - GIGAZINE

ChatGPTとGeminiとDeepSeekとClaudeで5つのテストをして最も優秀だったのはどのモデルなのか? - GIGAZINE

in ソフトウェア, Posted by log1i_yk

You can read the machine translated English article OpenAI releases o3-Pro, an improved mode….