【Claude Opus 4.8リリース】価格据え置きで「正直さ」と「判断力」を強化、努力制御機能と並列サブエージェントによる開発DX

URLをコピーしました！

Claude Opusが新バージョンの4.8にアップグレードされ、前バージョンの4.7を基に多方面のベンチマークで改善が図られています。提供価格は据え置きで、既存の利用者もそのまま移行可能とされています。今回のアップデートでは、モデルの応答にかける労力をユーザーが調整できる新コントロールが加わり、用途に応じた品質と速度の最適化がしやすくなりました。さらに、Claude Codeには非常に大規模な課題に対応できる動的ワークフローが導入され、エンタープライズ規模の開発運用にも対応する構えです。加えて、Opus 4.8の高速モードは最大2.5倍の速度に対応し、従来モデル比でコストを抑えられる運用が可能になりました。開発者向けにはMessages APIの拡張も行われ、タスク進行中の指示更新が柔軟になっています。

Opus 4.8の品質向上誠実さと整合性の評価が強化

初期テスターは、Opus 4.8がエージェント的タスクの実行で信頼性と判断力を高めたと報告しています。とりわけ顕著な改善点として、裏付けの薄い主張を避け、不確実性を自ら指摘する姿勢が強まったことが挙げられます。評価では、自己生成コードの欠陥を見落とす可能性が前モデルより約4分の1低いとされ、実務での検証負荷を下げる効果が期待されます。アライメント面では、ユーザーの自律性支援や最善の利益に沿う行動など親社会的特性の指標で高評価を獲得しています。不適切行動率はOpus 4.7より大幅に低下し、Claude Mythos Previewと近い水準に達したとされています。安全性評価や一連の事前テストはシステムカードに整理され、モデルの整合性を担保する取り組みが継続しています。

動的ワークフローと努力コントロール大規模開発を支える新機能

同時公開のアップデートとして、Claude Codeにリサーチプレビューの動的ワークフローが実装されました。これにより、作業計画の立案から数百の並列サブエージェントの起動、出力の検証までを1セッションで完結できます。Opus 4.8ではエージェントの実行時間が延長され、数十万行規模のコードベース移行を既存のテストスイート基準で完了させた事例が示されています。利用可能プランはClaude Code for Enterprise、Team、Maxで、より大きな作業単位の処理が想定されています。あわせて、claude.aiとCoworkに努力コントロールが導入され、応答にかける労力を選択可能になりました。高い設定では深い思考と品質向上、低い設定では応答速度の向上とレート制限の節約に寄与します。努力管理は現時点で全プランに展開され、用途に応じた調整が行えます。

開発者向け拡張 Messages APIで指示更新が容易に

Messages APIはメッセージ配列内でシステムエントリを受け入れるようになり、タスク中にモデル指示を更新できるようになりました。これにより、プロンプトキャッシュを壊さずに権限やトークン予算、環境コンテキストを更新可能です。エージェントの実行中におけるルール変更や制約調整が柔軟になり、ワークフローの中断を最小化できます。併せて、Opus 4.8の高速モードはモデルが2.5倍の速度で動作できる構成が提供され、従来モデル比でコストが3倍安くなると説明されています。高負荷な開発や検証のサイクルにおいて、時間短縮と費用抑制の両面で効果が見込まれます。API経由での利用は開発者に開放され、claude-opus-4-8として指定可能です。これらの拡張は、既存の開発環境やエージェント基盤への統合を前提に設計されています。

価格と提供状況価格据え置きと高速モードの料率

提供価格はOpus 4.7から据え置きで、通常利用は入力トークン100万単位で5ドル、出力トークン100万単位で25ドルです。高速モードは入力トークン100万単位で10ドル、出力トークン100万単位で50ドルとされています。Opus 4.8は本日からどこでも利用可能と案内されており、開発者はClaude APIを通じてアクセスできます。モデルのデフォルト設定は高い努力水準で、品質と体験のバランスを重視した構成になっています。コーディングタスクでは、Opus 4.7のデフォルトとほぼ同じトークン消費で性能が向上する旨が示されています。難易度の高い作業や長時間の非同期処理には、エクストラや最大の設定が提案されており、Claude Codeでは高い労力レベルに応じたレート制限も設けられています。

今後の展開低コストモデルとMythosクラスの提供計画

今後は、Opusに近い機能をより低コストで提供するモデルの開発とリリースを進める方針が示されています。さらに、Opusを上回る知能を持つ新しいモデルクラスの提供を計画し、Project Glasswingの一環として一部組織がサイバーセキュリティ業務でClaude Mythos Previewを活用しています。一般公開前には一段と強固なサイバーセキュリティ対策が必要とされ、対策の整備が進んでいると説明されています。数週間以内にMythosクラスのモデルを全顧客に提供できる見込みが示され、導入準備が加速しています。評価指標に関する脚注も更新され、ターミナルベンチ2.1やOSWorld Verifiedの扱い、Finance Agent v2のスコアの言及が追加されています。モデルの能力測定の透明性を高める狙いがうかがえます。

詳しくは「Claude」の公式ページまで。レポート／DXマガジン編集部

シェアはこちらから