実務はここまで自動化できるのか。OpenAIが発表した「GPT5.4」は、推論とエージェントを前提に再設計されました。最大100万トークンの長文脈やコンピュータ操作のネイティブ対応など、業務要件に直結する更新が並びます。数字で示された性能差と提供条件を基に、導入判断の勘所を整理します。
業務生産性を直撃する「推論×操作」の統合進化
OpenAIは2026年3月5日、ChatGPT、API、CodexでGPT5.4の提供を開始しました。上位版のGPT5.4 Proも同時公開されています。特徴は、推論、コーディング、エージェント型ワークフローを単一モデルに統合した点です。100万トークンのコンテキストに対応し、長期タスクの計画、実行、検証を一貫させます。さらに、ツールを効率選択する「tool search」により、大規模なツール群でもトークン消費を抑えながら処理できます。結果として、少ない往復で成果物に到達しやすくなり、処理速度とコストの両面での効率化が見込めます。
ChatGPTでは「GPT5.4 Thinking」が導入され、最初に進め方を提示しつつ、応答途中での方針調整に対応します。ウェブ調査機能が強化され、具体的なクエリにも粘り強く対応します。文脈保持も改善され、長いワークフローでも一貫性を保ちます。APIとCodexでは、スクリーンショットを基にキーボードやマウス操作を出すなど、コンピュータ操作が可能になりました。Playwright等の自動化でも成果が出やすく、開発者メッセージで挙動を調整できます。
ベンチマークの数値は性能差を明確に示します。知識業務のGDPvalで83.0%に達し、GPT5.2の70.9%を上回りました。OSWorld Verifiedでは成功率75.0%で、人間の72.4%とGPT5.2の47.3%を超えています。BrowseCompは82.7%で、検索の繰り返しと統合力の改善がうかがえます。SWE Bench Proでは57.7%で、コーディング領域も伸長しました。事実性も向上し、個々の主張の誤り率は相対33%低下、回答全体の誤りを含む確率も相対18%低下しています。
業務アプリ作成や資料作成の精度も強化されています。投資銀行アナリストの初級業務を想定したスプレッドシート社内評価では平均87.5%で、GPT5.2の68.4%を上回りました。プレゼンテーション評価では、人手評価で68.0%の比較でGPT5.4が支持されました。視覚理解ではMMMU Proが81.2%、文書解析のOmniDocBenchは平均誤差0.109で、いずれもGPT5.2より改善しています。高密度画像の認識も向上し、originalやhighのディテール設定に新対応しました。
開発体験の面では、Codexの/fastモードで最大1.8倍の高速化が可能です。優先処理オプションやキャッシュの活用でレイテンシを抑えつつ、複数ツールを伴う長いフローを完了できます。Toolathlonでは少ないターンで高精度を示し、Online Mind2Webではスクリーンショット入力のみで92.8%の成功率でした。WebArena Verifiedでも67.3%を記録し、ブラウザ操作の堅牢性が高まっています。開発向けには、Playwrightで画面を見ながらデバッグする実験スキルも公開されています。
提供と料金も明確です。APIはgpt 5.4とgpt 5.4 proの2系統で、本日から段階的に提供開始です。APIの入力は100万トークンあたり2.50ドル、出力は15ドルで、GPT5.2より高単価ながらトークン効率の改善で総コスト抑制が期待できます。ChatGPTではPlus、Team、ProにGPT5.4 Thinkingを提供し、EnterpriseとEduは管理者の早期アクセス設定で有効化できます。ProとEnterpriseではGPT5.4 Proも利用可能です。BatchとFlexは標準の半額、優先処理は2倍で提供されます。
安全性面ではHigh cyber capabilityとして、System Card記載の保護措置を適用し展開されています。拡張セキュリティスタックや信頼されたアクセス制御のほか、一部顧客には高リスクリクエストのルーティングやブロックを適用します。CoT controllabilityの公開評価では、GPT5.4 Thinkingは推論隠蔽の制御性が低いとされ、監視手法の有効性が示されています。誤検知低減と不正利用防止の両立を目指し、分類器の調整も継続中です。
見解として、100万トークンとコンピュータ操作の両対応は、長期業務の自動化に向けた分岐点になります。料金と効率のバランスは、tool searchやキャッシュの活用設計が鍵を握るはずです。
詳しくは「OpenAI」の公式ページまで。 レポート/DXマガジン編集部






















