AIモデルの進化は、サイバー攻撃の手法を高度化させる一方で、防御側の能力を爆発的に引き上げる両刃の剣です。Anthropic(およびパートナー企業)は2026年5月22日、世界で最も重要なソフトウェアをサイバー脅威から保護するための共同プロジェクト「プロジェクト・グラスウィング(Project Glasswing)」の発足1ヶ月目のレポートを公開しました。
最先端モデル「Claude Mythos Preview」を投入したことで、わずか数週間で1万件以上の重大な脆弱性が発見されるなど、驚異的な成果と同時に「AIの発見スピードに、人間の修正リソースが追いつかない」というサイバーセキュリティにおける新たなボトルネックが浮き彫りになっています。
1ヶ月で1万件以上の脆弱性を検出。バグ発見率が「10倍以上」に跳ね上がった初期成果
インターネットや重要インフラを支える大手パートナー企業が自社コードを「Claude Mythos Preview」でスキャンした結果、サイバー防御の歴史を塗り替えるデータが報告されました。
- Cloudflare:クリティカルパス(重要システム)全体で2,000件のバグ(うち400件は重大な脆弱性)を検出。誤検出率は人間のテスターよりも優れていると評価。
- Mozilla(Firefox):Firefox 150のテスト中に271件の脆弱性を発見・修正。これは前世代モデル(Claude Opus 4.6)を用いた旧バージョンと比べて10倍以上の発見数。
- 国家機関・ベンチマークでの実証:英国のAIセキュリティ研究所(UK AISI)は、Mythos Previewが2つのサイバーレンジ(多段階サイバー攻撃のシミュレーション)をエンドツーエンドで解決した最初のモデルであると報告しています。
インターネットの土台(オープンソース)に潜む6,200件の重大な危機と「人間の過負荷」
インフラの大部分を支える1,000以上のオープンソースプロジェクト(OSS)をスキャンしたところ、セキュリティのエコシステムが悲鳴を上げる事態となっています。
- 高精度な真陽性率:推定23,019件(うち深刻度「高」または「致命的」が6,202件)の脆弱性を検出。外部のセキュリティ専門会社が慎重に検証したところ、90.6%が有効な脆弱性(真陽性)であることが証明されました。
- CVE-2026-5194(wolfSSLの脆弱性):世界中で数十億台のデバイスが採用する暗号化ライブラリ「wolfSSL」において、攻撃者が正規の銀行やメールプロバイダーを完全に偽装できるエクスプロイト(脆弱性)を発見し、悪用される前にメンテナーへ報告。
- ボランティアの限界:AIによって脆弱性を特定することは格段に容易になったものの、オープンソースを支えるボランティアのメンテナー側の「トリアージ、検証、パッチ(修正プログラム)の設計」を行う人手が圧倒的に不足しています。複数のメンテナーから「対応能力を超えているため、情報公開(開示)のペースを落としてほしい」との悲痛な要請が入るなど、エコシステム全体のキャパシティ不足が深刻な課題です(重大なバグの修正には平均2週間を要しています)。
サイバー防御担当者への適応支援。企業向け「Claude Security」の展開
Mythosクラスの超高度なモデルが近い将来広く利用可能になれば、攻撃者が脆弱性を悪用するタイムラグやコストが劇的に下がります。この「中間期間」のパッチギャップを埋めるため、防御側へ様々なツールが解放され始めています。
- 企業向け「Claude Security」パブリックベータ開始:Claude Enterpriseユーザー向けに、コードベースをスキャンして自動で修正案まで生成するツールをリリース。すでに「Claude Opus 4.7」を用いて3週間で2,100件以上の脆弱性が高速に修正されています(企業内コードのため、OSSよりもパッチ適用が速いのが特徴)。
- サイバー検証プログラムとツールのリクエスト解放:セキュリティ専門家が当社のモデルを脆弱性調査や侵入テスト(レッドチーム演習)に安全に使えるよう、不正悪用防止策を講じたうえで、パートナーらが使用してきた「タスク自動化手順(スキル)」「サブエージェント起動ハーネス」「脅威モデル構築ツール」をリクエストに応じて提供開始。
- シスコ(Cisco)による貢献:パートナー企業であるシスコは、他のサイバー防御担当者が同様のAI評価システムを構築できるよう、「Foundry Security Spec」をオープンソース化しました。
なぜ「Mythosクラス」を一般公開しないのか
Anthropicを含め、現在世界中のどのAI企業も、「Mythosクラスのモデルが安全対策なしに公開された場合、その悪用を完全に防ぎ、深刻な被害を回避できるほどの強力なガードレール(安全対策)」を開発できていません。 もし一般公開されれば、世界中のほぼ誰もが、あらゆるソフトウェアの欠陥を安価かつ超高速に悪用できてしまう暗黒時代が到来します。そのため、安全対策が確立されるまでは非公開とし、まずは米国および同盟国政府や重要インフラのサイバー防御担当者へ優先的にアクセスを拡大して「防御側の非対称的な優位性」を築く方針です。
見解:これまでのサイバーセキュリティの戦場は「いかに早くバグを見つけるか」でしたが、AIエージェントが秒速で万単位の脆弱性を見つけ出すようになった今、戦場は「いかに早く人間がパッチを当て、エコシステムに展開できるか」という『人間の処理速度と開発運用の自動化(DevSecOps)』へと完全にシフトしました。 悪用されれば大惨事になるMythosクラスの一般公開をあえて止め、防御側のエンタープライズや政府機関に「Claude Security」などの盾(自動パッチ生成ツール)を先行配備するAnthropicの戦略は、情報空間のバランスを保つ上で極めて賢明かつ責任あるインフラDXの姿勢です。
詳しくは「Anthropic / Frontier Red Team ブログ」の公式レポートまで。 レポート/DXマガジン編集部





















