GPT-5.4登場、複雑業務を“一発完結”へ　OpenAIが新モデル公開

URLをコピーしました！

OpenAIは、ChatGPT、API、Codexで利用可能なGPT-5.4を公開し、業務用途に最適化した高性能フロンティアモデルを提供開始した。高度な推論、コーディング、エージェント型ワークフローを単一モデルに統合し、複雑な実務をより少ないやり取りで完了できるようにした。ChatGPTではGPT-5.4 Thinkingが計画を前置き表示し、進行中でも軌道修正しやすくしたほか、検索と長文脈の保持を強化した。APIとCodexでは、最大100万トークンのコンテキストをサポートし、ツール選択の最適化やコンピュータ操作をネイティブに実行できるようにした。推論効率の改善により、GPT-5.2比でトークン使用量を削減して高速化を実現した。

評価指標では、知識業務ベンチマークGDPvalで83.0%に達し、SWE-Bench ProやOSWorld-Verified、BrowseCompなど複数のベンチマークで従来モデルを上回った。スプレッドシートやプレゼンテーション、ドキュメント生成の品質が向上し、社内評価では投資銀行アナリスト相当のモデリング課題で平均87.5%のスコアを示した。視覚認識もMMMU-Proで81.2%を記録し、OmniDocBenchの平均誤差を0.109まで改善した。画像入力ディテールにoriginalとhighを導入し、高解像度画像の忠実な理解に対応した。

開発者向けでは、tool searchを導入し、多数のツール定義をオンデマンドで呼び出す設計に改めることで、MCP環境で総トークンを最大47%削減した。Toolathlonでのマルチステップ実行でも精度とターン効率を高め、τ2-benchの推論なし条件でも性能を更新した。Codexの/fastモードやAPIの優先処理により、レイテンシを抑えつつ精度を維持する運用が可能となる。エージェントによるデスクトップやブラウザの操作成功率も向上し、長時間タスクの計画、実行、検証を安定して行えるようになった。

詳しくは「OpenAI」の公式ページまで。レポート／DXマガジン編集部　權

シェアはこちらから