Mythos を上回る GPT‑5.5 の実力、英国 AISI が明かした AI サイバー能力と複数モデルが同時に危険領域へ到達したこと

요약

영국 정부의 AI Security Institute(AISI) 평가에 따르면, OpenAI의 GPT-5.5가 Anthropic의 Claude Mythos Preview와 동등하거나 일부 지표에서 능가하는 수준의 사이버 공격 능력을 갖춘 것으로 나타났습니다. AISI는 이러한 능력 향상이 특정 모델의 돌파구가 아니라 '프론티어 AI 전체'의 구조적이고 전반적인 트렌드임을 강조했습니다. 이는 기업과 정부가 개별 모델에 대한 경계를 넘어, AI 산업 전반의 급격한 능력 상승이라는 새로운 패러다임에 대비해야 함을 시사합니다.

핵심 포인트

GPT-5.5는 Mythos와 동등하거나 일부 영역에서 우위를 보이는 수준의 사이버 공격 능력을 입증했습니다.
AISI는 이 능력 향상이 특정 모델만의 특성이 아닌, 프론티어 AI 전체가 공유하는 구조적 트렌드임을 명확히 했습니다.
AI 모델의 추론력, 자율성, 코딩 능력 발전이 자연스럽게 공격 자동화 및 속도 증가로 이어지고 있습니다.
기존의 '특정 모델 제한' 방식으로는 부족하며, 산업 전반의 AI 능력 상승에 대응하는 새로운 사이버 방어 전략이 필요합니다.

英国政府の AI Security Institute（AISI）の評価によれば、GPT‑5.5 は Anthropic の Claude Mythos Preview と同等レベルのサイバー攻撃能力に到達し、一部の指標では Mythos を上回ったと発表された。

特に注目すべきは、AISI が「これは特定モデルの異常値ではなく、フロンティア AI 全体の能力向上トレンドである可能性が高い」と明言した点である。

これは一般提供されている OpenAI の GPT‑5.5 が同じ領域に到達したことで、複数のモデルが同時期に同じ能力帯へ到達しているという構図が明確になった。

まさに、AI の推論力・自律性・コーディング能力の向上が副次的に攻撃能力を押し上げていることを示唆しており、企業・政府にとっては「特定モデルを警戒すればよい」という段階を超え、業界全体の能力上昇に備える必要があるという新たなフェーズに入ったことを考えてみたい。

参考：Our evaluation of OpenAI's GPT-5.5 cyber capabilities

AI Security Institute（AISI）とは

英国政府の AI Security Institute（AISI）は、科学・技術・イノベーション省（DSIT）内に設置された政府系研究機関であり、フロンティア AI モデルの安全性・能力評価を専門的に行う唯一の公的機関。

AISI は 2023 年以降、AI モデルのサイバー攻撃能力を継続的に追跡しており、チャット形式の調査から始まり、企業ネットワーク侵入シミュレーションへと段階的に評価難度を引き上げてきた。

注目すべきは AISI の評価が統一された環境で複数モデルを比較できる政府公式ベンチマークである点であることだ。

SNS の噂や企業の自己申告ではなく、同一条件下での比較が可能なため、モデル間の能力差や業界全体の傾向を客観的に把握できる。

2026 年 4 月には Anthropic の「Claude Mythos Preview」を評価し、史上初めて企業ネットワーク攻撃シミュレーションを完遂したモデルとして注目を集めた。

今回の GPT‑5.5 評価は、その継続的研究の一環であり、AISI が世界的に最も信頼される AI サイバー能力評価機関であることを改めて示したことにもなる。

AISI の評価方法

AISI は GPT‑5.5 に対し、CTF 形式の狭いサイバー課題 (95 タスク) と、企業ネットワーク攻撃シミュレーション (TLO) の 2 系統で評価を行っている。

■ CTF（Capture The Flag）

CTF は脆弱性調査・リバースエンジニアリング・暗号解析など、特定スキルを測る狭い課題群で、AISI はこれを 4 段階（Basic／Practitioner／Advanced／Expert）に分類。

Expert 成功率：

Mythos＝68.6%
GPT‑5.5＝71.4%

■ TLO（The Last Ones）

TLO は 32 ステップの企業ネットワーク侵入シミュレーションで、偵察→認証情報窃取→AD 横展開→CI/CD 侵害→データ奪取まで含む実戦級の演習。

Mythos：10 回中 3 回完遂
GPT‑5.5：10 回中 2 回完遂（史上 2 例目）

これらの結果は、GPT‑5.5 が高度な脆弱性研究・攻撃チェーン構築を自律的に行えることを示している。

AISI は何を言いたいのか

AISI の主張は明確である。

「これは特定モデルのブレイクスルーではなく、フロンティア AI 全体の能力上昇トレンドである」。

今回 GPT‑5.5 が同等レベルに到達したことで、AISI はその問いに対し「より広いトレンドである可能性が高い」と結論づけている。

また「これらは制御された環境での能力評価であり、防御者が存在する現実世界で成功するとは限らない」とも強調している。

つまり、AISI は危険性の誇張ではなく、能力の実態と限界を冷静に評価する立場を取っており、さらに AISI は GPT‑5.5 の一般公開版に施された追加セキュリティ対策の検証も行い、専門家が 6 時間の演習で違反コンテンツ生成に成功したことを報告している。

これらの結果は、モデル能力の向上と安全対策の追いつかなさという二つの課題を同時に示している。

攻撃能力向上の重要性

AISI が最も強調しているのは、AI モデル全体が急速に攻撃能力を伸ばしているという業界的トレンドの存在である。

単一モデルの危険性を議論する段階を超え、AI 産業全体の構造的リスクとして捉える必要があることを意味する。

モデルの推論力・自律性・コーディング能力の向上は、自然言語処理やエージェント機能の進化とともに、攻撃チェーンの自動化・高速化をもたらす。

すなわち従来の「人間専門家に依存した攻撃・防御モデル」が崩れつつあることを示している。

AISI は、複数のモデルが同時期に同じ能力帯へ到達していることを根拠に、「これは特定企業の問題ではなく、フロンティア AI 全体の進化の帰結である」と指摘する。

企業や政府は、特定モデルの利用制限だけでは不十分であり、AI 能力の構造的上昇に対応した新しいサイバー防衛戦略が必要になるだろう

AI 자동 생성 콘텐츠

원문 바로가기