脆弱性発見に特化したAI「Claude Mythos Preview」登場：Anthropicが主導する防御プロジェクト「Project Glasswing」の全貌 | 気になる AI ニュース

📝 概要

Anthropicは2026年4月7日、サイバー攻撃性能を飛躍的に向上させた新モデル「Claude Mythos Preview」を発表しました。本モデルはソフトウェアの脆弱性を自律的に特定・悪用する能力において、既存のAIや多くの専門家を凌駕する性能を有しています。Anthropicはこの技術がもたらす潜在的な脅威に対抗するため、MicrosoftやApple、Linux Foundationなどの主要組織と連携し、AIを防御目的に活用する「Project Glasswing」を始動しました。高度化するAI時代のセキュリティリスクに対し、防衛側が先んじてAIを運用する体制の構築が急務となっています。

📋 詳細レポート

人間を上回る脆弱性発見能力と実戦的な性能

Claude Mythos Previewは、コーディング、推論、PCの自動操作といった各性能において、従来のフラグシップモデルであるClaude Opus 4.6を大幅に上回るスコアを記録しています。特筆すべきは「ソフトウェアの脆弱性を発見し、悪用する能力」です。Anthropicの報告によれば、その能力は一握りの専門家を除いた大半の人間を上回るレベルに達しています。

具体的なタスクとして「Firefoxの脆弱性を悪用したエクスプロイトの作成」を試行した際、従来モデルはほぼ失敗に終わったのに対し、Mythos Previewは72.4％という極めて高い成功率を収めました。これは、AIが単なるコード生成の補助に留まらず、システムの構造的欠陥を自律的に突く段階に入ったことを示唆しています。

既存ソフトウェアにおける深刻な脆弱性の特定

本モデルは、既に現実世界で広く稼働しているソフトウェアから、長年見過ごされてきた脆弱性を次々と発見しています。

OpenBSD: 27年前から潜んでいた、遠隔からマシンをクラッシュさせることが可能な脆弱性を発見。
FFmpeg: 16年前から存在し、自動テストツールによる500万回のスキャンでも検知できなかった脆弱性を発見。
Linuxカーネル: 複数の脆弱性を発見。さらにそれらを論理的に組み合わせ、システムへの完全なアクセス権限を得るエクスプロイトを自律的に作成。

これらの成果は、AIが人間や従来のツールでは到達できなかった深部までコードを解析できる能力を持つことを実証しています。

AIによる防御イニシアチブ「Project Glasswing」

Anthropicは、攻撃能力の高いAIが一般に普及するのは時間の問題であると警鐘を鳴らしており、攻撃者に先んじて脆弱性を修正するためのプロジェクト「Project Glasswing」を開始しました。

本プロジェクトには、AWS、Apple、Google、Microsoft、NVIDIAなどのIT大手に加え、金融機関やセキュリティ企業、Linux Foundationといった計40以上の組織が参加する予定です。参加組織には最大1億ドル相当のAI利用クレジットが提供され、Mythos Previewを活用した重要ソフトウェアの保護が推奨されます。また、Apache Software Foundationなどのオープンソース団体に対しても、数百万ドル規模の資金提供が行われる方針です。

今後の展望と安全性の確保

Anthropicは、Claude Mythos Previewの一般公開を予定していません。現在は政府機関と協議を進めつつ、危険な出力を確実に遮断するためのセーフガード構築に注力しています。

今後は、次期モデルである「Claude Opus」においてこれらのセーフガードをテストし、安全性を担保した上でのスケールアップを目指すとしています。AIによるサイバー攻撃の脅威が現実味を帯びる中、防御側がいかに迅速にAIを組み込み、エコシステムの堅牢性を高められるかが焦点となります。