
Claude Mythos Preview 입문 — Project Glasswing과 AI 제로데이 발견의 전모
요약
Anthropic이 사이버 보안 능력이 비약적으로 향상된 새로운 프론티어 모델 'Claude Mythos Preview'를 발표했습니다. 이 모델은 자율적인 익스플로잇 개발 능력을 갖추었으며, 방어 목적의 산학관 협력 이니셔티브인 'Project Glasswing'을 통해 제한적으로 활용됩니다.
핵심 포인트
- Claude Mythos Preview는 사이버 보안 및 코딩 벤치마크에서 압도적 성능 기록
- Firefox JS 엔진 공격 등 실제 제로데이 취약점 발견 및 익스플로잇 능력 보유
- Project Glasswing을 통해 12개 주요 기업과 협력하여 보안 방어에 활용
- 일반 공개 없이 Project Glasswing 참여 조직에만 제한적 액세스 제공
2026년 4월 7일, Anthropic은 이례적인 발표를 했습니다. 새로운 프론티어 모델(Frontier Model)인 "Claude Mythos Preview"가 모든 주요 OS 및 모든 주요 브라우저에서 제로데이 취약성(Zero-day Vulnerability)을 대량으로 발견할 수 있는 수준에 도달했다는 내용입니다.
동시에 발표된 "Project Glasswing"은 이 모델을 방어 목적으로만 한정하여 활용하기 위한 산학관 협력 이니셔티브(Initiative)입니다. AWS, Apple, Google, Microsoft, NVIDIA 등 12개의 주요 조직이 참여하며, $100M(약 1억 달러) 규모의 모델 이용 크레딧이 출연되었습니다.
Mythos Preview는 일반 공개되지 않았습니다. 하지만 이 발표는 AI의 보안 능력이 임계점을 넘었음을 보여주는 마일스톤(Milestone)입니다.
-
Claude Mythos Preview의 기술 사양과 벤치마크 (Benchmark)
-
Project Glasswing의 메커니즘과 참여 조직
-
실제로 발견된 제로데이 취약성 사례 (CVE 포함)
-
API 사양·요금·액세스 방법
-
보안 엔지니어에 대한 실질적인 영향
-
보안 엔지니어(Security Engineer)·침투 테스터(Penetration Tester)
-
DevSecOps 엔지니어
-
AI의 능력 한계에 관심을 가진 소프트웨어 엔지니어
-
Claude Mythos Preview는 SWE-bench Verified 93.9%, CyberGym 83.1%를 달성한 Anthropic의 비공개 프론티어 모델
-
Firefox의 JS 엔진 취약점 공격에서 181회 성공 (Opus 4.6은 2회)이라는 압도적인 사이버 능력
-
Project Glasswing은 12개 조직 + 40개 이상의 조직이 참여하며, $100M의 크레딧으로 중요 인프라를 보호
-
일반 공개 없음. 액세스는 Project Glasswing 참여 조직만 가능 (요금: $25/$125 per MTok)
-
CVE-2026-4747 (FreeBSD 17년 전의 취약성) 등 수천 건의 제로데이를 발견 완료
Claude Mythos Preview는 2026년 4월 7일에 Anthropic이 발표한 범용 프론티어 모델입니다.
We are announcing Claude Mythos Preview, a new general-purpose language model that performs strongly across the board, but is strikingly capable at computer security tasks.
— Anthropic, red.anthropic.com (2026-04-07)
기존 모델과의 최대 차이점은 사이버 보안 능력의 비약적인 향상입니다. 단순히 취약성을 "탐지"하는 것뿐만 아니라, 익스플로잇(Exploit)을 "자율적으로 개발 및 실행"하는 능력을 갖추고 있습니다.
Project Glasswing 페이지에 공개된 벤치마크 결과는 다음과 같습니다.
| 벤치마크 (Benchmark) | Claude Mythos Preview | Claude Opus 4.6 |
|---|---|---|
| CyberGym (취약성 재현) | 83.1% | 66.6% |
| SWE-bench Verified | 93.9% | 80.8% |
| SWE-bench Pro | 77.8% | 53.4% |
| Terminal-Bench 2.0 | 82.0% | 65.4% |
| GPQA Diamond | 94.6% | 91.3% |
CyberGym 점수가 +16.5포인트 향상된 점이 특기할 만합니다. 일반적인 코딩·추론에서도 모든 항목에서 Opus 4.6을 상회하고 있습니다.
Anthropic이 공개한 테스트 결과는 충격적인 수치를 보여줍니다.
Firefox의 JavaScript 엔진 공격:
수백 번의 시도에 대해 Opus 4.6은 2회의 익스플로잇 성공에 그친 반면, Mythos Preview는 181회의 성공을 기록했습니다.
OSS-Fuzz (OSS 퍼징 테스트):
| 지표 (Metric) | Mythos Preview | Opus 4.6 |
|---|---|---|
| Tier 1-2 크래시 (Crash) | 595건 | — |
| Tier 5 (풀 컨트롤 플로우 탈취) | 10건 | — |
| Tier 3 크래시 (Crash) | — | 1건 |
또한, 다음과 같은 고도의 공격 기법을 자율적으로 실행할 수 있음이 확인되었습니다.
- Linux 및 기타 OS에서의 로컬 권한 상승 (Race Condition, KASLR Bypass 악용)
- 4개 이상의 취약점을 체이닝(Chaining)한 복합 익스플로잇(Exploit) 구축
- 렌더러 샌드박스(Renderer Sandbox) 및 OS 샌드박스를 돌파하는 JIT 힙 스프레이(Heap Spray)
- ROP 체인(ROP Chain)과 원격 코드 실행(RCE) 익스플로잇의 자율 생성
Anthropic은 "Mythos Preview를 그대로 API로 공개할 수는 없다"고 판단했습니다. 이 능력을 악용하면 전 세계의 중요 인프라가 파멸적인 위험에 처하게 됩니다.
그래서 출범한 것이 Project Glasswing입니다. 방어 측이 먼저 취약성을 발견하고 수정할 수 있도록, AI의 능력을 제한적으로 활용하기 위한 프레임워크입니다.
"취약성이 발견된 시점과 공격자에 의해 악용되는 시점 사이의 시간적 간극이 붕괴되었습니다. 과거에는 몇 달이 걸리던 일이 이제 AI와 함께라면 몇 분 만에 일어납니다."
— CrowdStrike CTO Elia Zaitsev (Project Glasswing 페이지에서 인용)
12개의 창립 파트너:
| 섹터 | 조직 |
|---|---|
| 클라우드 | Amazon Web Services, Google, Microsoft |
| ... |
창립 파트너 12개 조직 외에도, 중요 소프트웨어 인프라를 구축하고 유지하는 40개 이상의 조직이 확장 액세스(Extended Access) 권한을 부여받았습니다.
| 내역 | 금액 |
|---|---|
| Glasswing 참여 조직용 모델 이용 크레딧 | $100M |
| ... |
Project Glasswing에서는 책임 있는 공개 (Coordinated Vulnerability Disclosure, CVD)를 엄격하게 적용하고 있습니다.
- Mythos Preview가 취약성 발견
- SHA-3 해시로 발견 내용 커밋 (시점 증명)
- 소프트웨어 메인테이너에게 통지 (90일 + 45일 연장 옵션)
- 패치 적용 후 상세 내용 공개
현재 시점에서 발견된 취약성의 99% 이상이 아직 수정되지 않았기 때문에, 구체적인 내용은 공개되지 않았습니다.
Anthropic이 공개한 수정된 취약성들을 통해 Mythos Preview의 능력을 엿볼 수 있습니다.
심각도: Critical -
발견: Mythos Preview가 완전 자율적으로 특정 및 익스플로잇 -
개요: NFS를 실행 중인 FreeBSD 머신에 대해, 인터넷상의 미인증 사용자가 원격으로 서버의 완전한 제어권을 획득할 수 있음 -
연령: 약 17년 전에 유입된 버그 -
수법: 풀 커널 ROP 체인을 통한 원격 코드 실행 (RCE)
개요: 부호 있는 정수 오버플로 (Signed Integer Overflow)로 인한 원격 서비스 거부 (DoS) -
연령: 27년 전부터 존재했던 구현상의 결함 -
의의: 가장 널리 리뷰되는 OSS 중 하나에서도 오랜 기간 간과되어 옴
개요: H.264 슬라이스 트래킹(Slice Tracking) 처리 관련 취약성 -
상세: 2003년에 유입되었으며, 2010년에 악용 가능한 형태로 변화 -
의의: 영상 처리 라이브러리로서 수십억 개의 장치에서 사용되는 FFmpeg에서의 발견
이러한 사례들은 인간 보안 연구자가 몇 년에 걸쳐 찾아내지 못했던 취약성을 AI가 자율적으로 특정할 수 있음을 보여줍니다.
| 항목 | 요금 |
|---|---|
| 입력 토큰 | $25 / 1M 토큰 |
| 출력 토큰 | $125 / 1M 토큰 |
Opus 4.6($5/$25)의 5배 가격 설정입니다. 다만 실제 비용 체감은 공개된 정보에 따르면 취약성 발견 1회당 약 $50~$2,000 정도이며, FFmpeg 분석의 경우 수백 번의 실행으로 "약 $10,000"가 소요되었다고 합니다.
Mythos Preview는 현재 일반 공개되지 않았습니다. 액세스할 수 있는 경로는 다음과 같습니다.
Project Glasswing 참여 조직 (12개 창립 멤버 + 40개 이상의 확장 멤버) -
Claude for Open Source Program (중요 OSS 인프라 메인테이너 대상)
일반 엔지니어가 액세스하려면, 소속 조직이 Project Glasswing 멤버이거나 중요 OSS의 메인테이너로서 신청을 통과해야 합니다.
Project Glasswing 참여자는 다음 플랫폼을 통해 이용할 수 있습니다.
import anthropic
client = anthropic.Anthropic()
# 실제 모델 ID는 Project Glasswing 참여 조직에 개별 제공됨
...
- Claude API (직접)
- Amazon Bedrock
- Google Cloud Vertex AI
- Microsoft Foundry
기존에는 중요한 제로데이 (Zero-day) 취약성을 발견하기 위해 숙련된 보안 연구자가 수주에서 수개월을 소요해야 했습니다. Mythos Preview의 등장으로 이 비용 구조가 근본적으로 변화합니다.
| 작업 | 기존 | Mythos Preview |
|---|---|---|
| OpenBSD 조사 1,000회 | 불가능 | 약 $20,000 이하 |
| ... |
현재 발견된 취약성의 99% 이상이 수정되지 않은 상황은 취약점 수정 에코시스템 전체에 과제를 던지고 있습니다.
- OSS 메인테이너의 패치 대응 속도가 따라가지 못할 가능성
- 자동 패치 생성 및 적용 도구에 대한 수요 증가
- 보안 연구자의 역할 변화 (발견자 → 트리아저(Triage)·수정자로의 전환)
Anthropic과 파트너는 90일 이내에 지식을 공유할 예정입니다. 일반 엔지니어가 할 수 있는 일은 다음과 같습니다.
- 의존성 업데이트 철저히 하기: Mythos Preview가 발견한 취약성이 순차적으로 공개되므로 정기적인 업데이트가 중요함
- CVE 추적 도구 활용: 향후 발표될 수정 패치를 놓치지 않도록 자동 알림 설정
- 코드 리뷰에 AI 활용: Claude Security (Opus 4.7 기반) 등을 통해 기존 코드를 사전 점검
- OSS 기여: Linux Foundation, Apache 등에 대한 지원이 보안 에코시스템 전체를 강화
Anthropic은 차기 Claude Opus 모델에 "위험한 출력을 탐지 및 차단하는 세이프가드 (Safeguard)"를 탑재할 예정입니다.
이 세이프가드로 인해 영향을 받는 정식 보안 전문가를 위해, "Cyber Verification Program"의 신청 접수도 예정되어 있습니다.
우리의 궁극적인 목표는 Mythos급 모델의 대규모 안전 배포를 가능하게 하는 것입니다.
— Project Glasswing, Anthropic (2026-04-07)
Claude Mythos Preview와 Project Glasswing는 AI의 사이버 보안 능력이 인간 최상위 연구자를 넘어섰음을 공식적으로 보여주는, 업계 역사상 가장 중요한 발표 중 하나입니다.
- Mythos Preview의 실력: CyberGym 83.1%, Firefox 181회 익스플로잇 (Exploit) 성공, 수천 건의 제로데이 발견
- Project Glasswing의 의의: 방어 측이 선제 대응을 하기 위한 $100M 커밋, 12개 대기업 + 40개 이상의 조직 연합
- 일반 액세스: 현재 시점에서는 불가. 참여 조직 또는 중요 OSS 메인테이너만 가능
- 향후 동향: 90일 이내 지식 공유, 차기 Opus 모델에 Cyber 세이프가드 탑재
AI가 취약성을 자율적으로 발견할 수 있는 시대에, 방어 측 또한 동등한 AI 도구를 갖추는 것이 사이버 보안의 새로운 기준이 되고 있습니다.
- Claude Mythos Preview — Frontier Red Team Blog — 기술 상세 및 CVE 사례
- Project Glasswing: Securing critical software for the AI era — 이니셔티브 상세 및 참여 조직
- Anthropic's Mythos forces a rethink of vulnerability management — 업계 분석
- On Anthropic's Mythos Preview and Project Glasswing — Bruce Schneier 분석
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기