Anthropic의 AI가 10,000개의 치명적인 보안 버그를 발견했습니다. 이것이 모든 브랜드에 중요한 이유

원문은 The Searchless Journal에 게시되었습니다.

2026년 5월 22일, Anthropic은 지구상의 모든 소프트웨어 기업을 공포에 떨게 할 만한, 그리고 모든 브랜드가 "AI 가시성 (AI visibility)"이 실제로 무엇을 의미하는지에 대해 생각하는 방식을 재정립해야 할 만한 소식을 발표했습니다.

Anthropic의 미출시 프런티어 모델 (frontier model)인 Claude Mythos Preview는 모든 주요 운영 체제 (operating system)와 모든 주요 웹 브라우저 (web browser) 전반에서 수천 개의 제로 데이 취약점 (zero-day vulnerabilities)을 자율적으로 찾아냈습니다. 단순한 작은 버그가 아닙니다. 치명적인 보안 결함 (critical security flaws)이며, 일부는 27년 동안 눈에 띄지 않게 숨겨져 있었습니다.

Amazon Web Services, Apple, Cisco, Google, Microsoft, NVIDIA, JPMorganChase, 그리고 Palo Alto Networks를 포함하는 연합체인 Project Glasswing을 통해, 해당 모델은 이미 세계에서 가장 중요한 소프트웨어 인프라 (software infrastructure)에 투입되었습니다. 결과는 경이롭습니다. Cloudflare 한 곳에서만 인프라 전반에 걸쳐 약 2,000개의 취약점을 발견했습니다. Mozilla는 단 한 번의 Firefox 릴리스 사이클에서 271개의 취약점을 발견했는데, 이는 이전의 모델 지원 방식보다 10배나 많은 수치입니다.

이 사건은 사이버 보안 (cybersecurity) 이야기로 다뤄지고 있으며, 실제로 그러합니다. 하지만 이것은 그 이상의 의미를 갖습니다. 이는 AI 시스템이 이제 어떤 브랜드도 모니터링할 수 없는 깊이와 규모로 기업, 제품 및 인프라를 평가한다는 것을 입증하는 지점입니다. AI 모델이 여러분의 팀보다 먼저 코드베이스 (codebase)의 보안 태세 (security posture)를 평가하고, 소프트웨어의 품질을 판단하며, 숨겨진 약점을 식별할 수 있게 될 때, "AI 가시성 (AI visibility)"은 더 이상 ChatGPT가 답변에서 여러분의 브랜드를 언급하느냐의 문제가 아닙니다.

그것은 AI 시스템이 그들이 작동하는 모든 맥락에서 여러분을 정확하게 보느냐의 문제입니다.

Project Glasswing이 실제로 발견한 것

Mythos Preview가 무엇을 해냈는지 구체적으로 살펴봅시다. 규모가 중요하기 때문입니다.

Anthropic의 내부 팀은 Mythos Preview를 사용하여 OSS-Fuzz 코퍼스(corpus)에서 추출한 약 1,000개의 오픈 소스 리포지토리(repository) 전반을 탐색하며 약 7,000개의 엔트리 포인트(entry point)를 평가했습니다. 이 모델은 단순히 표면적인 크래시(crash)만을 찾아낸 것이 아닙니다. 5단계 심각도 척도(five-tier severity scale)를 기준으로, Mythos Preview는 이미 패치된 10개의 별도 대상에서 가장 심각한 범주인 완전한 제어 흐름 하이재킹(control-flow hijack)을 달성했습니다. Claude Opus 4.6 및 Claude Sonnet 4.6과 같은 이전 모델들은 이와 같은 성과를 단 한 번도 달성하지 못했습니다.

세 가지 발견 사례가 이러한 도약을 잘 보여줍니다:

OpenBSD의 27년 된 버그. OpenBSD는 보안 중심적인 것으로 유명한 운영 체제(OS)로, 전 세계적으로 방화벽과 핵심 인프라를 실행하는 데 사용됩니다. Mythos Preview는 27년간의 인간 검토와 수많은 자동화 스캔을 견뎌내며 살아남은 취약점을 발견했습니다. 이 취약점은 공격자가 해당 OS를 실행 중인 모든 머신에 연결하는 것만으로 원격에서 크래시를 발생시킬 수 있게 했습니다.

FFmpeg의 16년 된 버그. FFmpeg는 수많은 소프트웨어에 내장된 비디오 인코딩 및 디코딩 라이브러리입니다. 이 버그는 자동화 테스트 도구가 500만 번 — 무려 500만 번 —이나 접근했음에도 문제를 잡아내지 못했던 단 한 줄의 코드에 있었습니다.

다단계 Linux 커널 익스플로잇 체인(exploit chain). Mythos Preview는 전 세계 서버 대부분을 실행하는 소프트웨어인 Linux 커널에서 여러 취약점을 자율적으로 찾아내고 이를 체이닝(chaining)하여, 공격자가 일반 사용자 권한에서 머신의 완전한 제어 권한으로 권한 상승(escalate)을 할 수 있도록 했습니다.

이 중 어느 것도 인간의 가이드가 필요하지 않았습니다. Mythos Preview는 취약점을 식별하고, 그 중요성을 이해했으며, 많은 경우 작동하는 개념 증명(proof-of-concept, PoC) 익스플로잇을 완전히 스스로 작성했습니다. 공식적인 보안 교육을 받지 않은 Anthropic 엔지니어들이 모델에게 밤새 원격 코드 실행(remote code execution, RCE) 취약점을 찾아달라고 요청했고, 다음 날 아침 일어났을 때 완성된 작동 가능한 익스플로잇을 확인할 수 있었습니다.

Mythos Preview가 실제로 할 수 있는 것 — 그리고 이것이 보안 연구원들을 놀라게 한 이유

이전의 프론티어 모델 (Frontier models)에서 Mythos Preview로의 도약은 점진적인 변화가 아닙니다. 이는 AI가 코드를 다룰 수 있는 능력에 있어 질적인 변화입니다.

Cloudflare의 보안 팀은 Mythos Preview를 이전에 테스트했던 모든 모델과 차별화하는 두 가지 능력을 설명했습니다.

익스플로잇 체인 구축 (Exploit chain construction). 실제 공격은 드물게 단일 취약점에만 의존합니다. 공격자들은 여러 개의 작은 공격 프리미티브 (Attack primitives)를 체인처럼 연결합니다. 예를 들어, use-after-free 버그를 임의 읽기-쓰기 프리미티브 (Arbitrary read-write primitive)로 전환한 다음, 제어 흐름 (Control flow)을 하이재킹하고, 시스템의 완전한 제어권을 얻기 위해 ROP (Return-oriented programming) 체인을 조립하는 방식입니다. Mythos Preview는 전통적으로 백로그 (Backlog) 속에 보이지 않게 방치되었을 법한 여러 개의 낮은 심각도 버그들을 가져와, 이를 어떻게 하나의 더 심각한 익스플로잇으로 결합할지 추론할 수 있습니다. 이전 모델들은 흥미로운 버그를 식별하고 그것이 왜 중요한지에 대한 설명을 작성한 뒤 멈췄습니다. 하지만 Mythos Preview는 체인을 완성합니다.

증명 생성 (Proof generation). 버그를 찾는 것과 그것이 익스플로잇 가능하다는 것을 증명하는 것은 서로 다른 두 가지 작업입니다. Mythos Preview는 이 두 가지를 모두 수행합니다. 모델은 의심되는 버그를 트리거하는 코드를 작성하고, 해당 코드를 스크래치 환경 (Scratch environment)에서 컴파일한 뒤 실행합니다. 만약 프로그램이 예상대로 동작한다면 증명이 확인됩니다. 만약 그렇지 않다면, 모델은 실패한 출력값을 읽고 가설을 수정한 뒤 다시 시도합니다. 이 루프 (Loop)는 모델이 찾아낸 버그만큼이나 중요합니다. 작동하는 증명이 없는 의심스러운 취약점은 추측에 불과하기 때문입니다. Mythos Preview는 자율적으로 그 간극을 메웁니다.

한 주목할 만한 시연에서, Mythos Preview는 4개의 별개 취약점을 체인으로 연결한 웹 브라우저 익스플로잇 (exploit)을 작성하여, 렌더러 (renderer)와 운영체제 (OS) 샌드박스 (sandbox)를 모두 탈출하는 복잡한 JIT 힙 스프레이 (heap spray)를 구축했습니다. 또한 미세한 레이스 컨디션 (race condition)과 커널 주소 공간 배치 난독화 (KASLR) 우회를 악용하여 Linux 상에서 로컬 권한 상승 (LPE) 익스플로잇을 자율적으로 개발했습니다. 그리고 20개의 가젯 (gadget)으로 구성된 ROP 체인을 여러 네트워크 패킷에 분할하여, 인증되지 않은 사용자에게 완전한 루트 (root) 권한을 부여하는 FreeBSD의 NFS 서버 대상 원격 코드 실행 (RCE) 익스플로잇을 작성했습니다.

이것들은 이론적인 능력이 아닙니다. 모델이 인간의 유도 없이 실제로 자율적으로 수행한 결과들입니다.

파트너사들의 결과 또한 매우 극적입니다

Anthropic은 이러한 능력을 실험실 안에만 가두어 두지 않았습니다. Project Glasswing을 통해 50개 이상의 파트너 조직이 자체적인 방어 보안 작업을 위해 Mythos Preview를 사용할 수 있도록 권한을 부여했습니다. 단 두 곳의 파트너사 결과만으로도 그 실체를 알 수 있습니다.

Cloudflare는 자사의 리포지토리 (repository) 50개 이상을 대상으로 Mythos Preview를 실행했습니다. 이 모델은 약 2,000개의 취약점을 발견했으며, 그중 400개는 높음(high) 또는 치명적(critical) 심각도로 분류되었습니다. Cloudflare의 보안 팀은 Mythos Preview의 결과물이 이전의 AI 보조 스캐닝보다 "눈에 띄게 높은 품질"을 보였다고 언급했습니다. 즉, 모호한 결과가 적고, 재현 단계가 더 명확하며, 수정 또는 폐기 결정을 내리기까지 필요한 작업량이 더 적었다는 것입니다.

Mozilla의 결과는 상대적인 관점에서 훨씬 더 놀라웠습니다. 이전에 Mozilla가 Firefox JavaScript 엔진을 대상으로 Claude Opus 4.6을 실행했을 때, 해당 모델은 수백 번의 시도 중 정확히 2번 작동하는 셸 익스플로잇 (shell exploit)을 개발하는 데 성공했습니다. 동일한 실험을 수행한 Mythos Preview는 181번의 작동하는 익스플로잇을 개발했으며, 추가로 29번의 시도에서 레지스터 제어 (register control)를 달성했습니다. 이는 익스플로잇 개발 능력 면에서 약 90배의 향상을 의미합니다.

Palo Alto Networks는 Mythos Preview 테스트 이후 몇 주 동안 평소보다 5배 더 많은 패치(patch)를 발행했다고 보고했습니다. Microsoft는 이 작업을 통한 패치가 일반적인 보안 업데이트보다 "계속해서 더 커지는 추세"라고 언급했습니다.

이것이 단순한 사이버 보안 이야기가 아니라 AI 가시성(visibility) 이야기인 이유

이 지점이 이 글을 읽고 있는 모든 브랜드, 즉 사이버 보안 분야에 있는 브랜드뿐만 아니라 모든 브랜드에게 관련이 있는 부분입니다.

AI 가시성에 관한 대부분의 논의는 검색 엔진과 답변 엔진에 집중되어 있습니다. ChatGPT가 귀하의 브랜드를 언급합니까? Perplexity가 귀하를 인용합니까? Gemini가 귀하의 제품을 추천합니까? 이것들은 중요한 질문이며, 브랜드가 직면해야 했던 AI 가시성의 첫 번째 파도를 나타냅니다.

하지만 Mythos Preview는 대부분의 브랜드가 고려하지 못한 두 번째 파도를 보여줍니다. AI 시스템은 이제 검색 결과와 전혀 상관없는 맥락에서 귀하의 회사를 평가할 수 있는 능력을 갖추고 있습니다:

코드 및 인프라 평가 (Code and infrastructure assessment). 만약 귀하의 회사가 소프트웨어를 출시한다면 — 그리고 2026년에는 거의 모든 회사가 그렇게 할 것입니다 — AI 모델은 이제 이전에는 전문적인 인간 보안 연구원이 필요했던 수준으로 소프트웨어의 보안, 품질 및 신뢰성을 평가할 수 있습니다. 귀하의 코드베이스(codebase)는 기계에 의해 심판받고 있으며, 귀하는 그 평가 과정을 볼 수 없습니다.

컴플라이언스 및 리스크 스코어링 (Compliance and risk scoring). 금융 기관, 의료 기업 및 규제 산업은 이미 AI 기반 리스크 평가 도구에 의해 평가받고 있습니다. Mythos Preview 수준의 역량은 평가의 깊이가 향후 10배(an order of magnitude) 가량 증가할 것임을 의미합니다. 귀하의 소프트웨어 공급망(software supply chain)은 인간에게 결코 투명하게 공개되었던 방식과는 다른 방식으로 AI 시스템에 투명하게 드러나게 될 것입니다.

파트너 및 벤더 평가 (Partner and vendor evaluation). Cisco, AWS, Microsoft, JPMorganChase가 모두 소프트웨어 품질을 평가하기 위해 프런티어 AI 모델 (frontier AI models)을 사용하고 있다면, 이들은 단지 자신들의 코드만을 평가하고 있는 것이 아닙니다. 제로데이 취약점 (zero-day vulnerabilities)을 찾아내는 것과 동일한 능력이 벤더의 코드, 파트너 통합 (partner integrations), 그리고 공급망 의존성 (supply-chain dependencies)을 향할 수 있습니다. 만약 귀사가 기업들에게 기술을 판매하고 있다면, AI는 조달 결정 과정에서 귀사의 보안 태세 (security posture)를 채점하기 시작할 것입니다.

AI 매개 맥락에서의 신뢰와 평판 (Trust and reputation in AI-mediated contexts). AI 에이전트 (AI agents)가 제품을 추천하거나, 벤더를 평가하거나, 구매 결정을 내릴 때, 이들은 마케팅 문구나 검색 노출 그 이상의 정보를 포함하는 브랜드의 종합적인 이미지를 활용합니다. 소프트웨어 품질, 보안 이력, 패치 주기 (patch cadence), 그리고 취약점 노출 (vulnerability exposure)은 모두 AI 매개 브랜드 평가 (AI-mediated brand evaluation)에 입력되는 신호가 되고 있습니다.

AI 가시성 (AI visibility)이 단순히 "ChatGPT에 인용되는 것"에서 시작하고 끝난다고 생각하는 브랜드들은 이 흐름을 완전히 놓치고 있는 것입니다.

평가 격차는 커지고 있습니다

근본적인 비대칭성이 나타나고 있습니다. AI 시스템은 이제 기업 스스로가 따라갈 수 없는 깊이와 속도로 기업을 평가할 수 있습니다.

수치를 살펴보십시오. Mythos Preview는 약 7,000개의 코드 진입점 (code entry points)을 스캔하여 모든 주요 운영 체제 (operating system)에서 치명적인 취약점을 발견했습니다. 이 작업은 단 몇 주 만에 이루어졌습니다. 동일한 취약점들이 수년 또는 수십 년간의 인간 검토와 수백만 번의 자동화된 테스트를 통과하며 살아남아 왔던 것입니다.

이제 이를 확장해 보십시오. 유사한 능력을 갖춘 모델들이 더 널리 보급될 때 — 그리고 Anthropic은 "그러한 능력이 확산되는 데 그리 오래 걸리지 않을 것"이라고 명시적으로 언급했습니다 — 귀사의 소프트웨어를 이 정도의 깊이로 평가할 수 있는 조직의 수는 급격히 증가할 것입니다. 귀사의 취약점, 코드 품질, 보안 태세는 귀사가 AI의 감시를 인지하기도 훨씬 전에 AI 시스템에 노출될 것입니다.

대부분의 브랜드는 AI 시스템이 보안, 컴플라이언스 (Compliance), 또는 인프라 (Infrastructure) 맥락에서 자신들을 어떻게 평가하는지에 대해 전혀 가시성 (Visibility)을 확보하지 못하고 있습니다. 그들은 이를 모니터링하지 않습니다. 측정하지도 않습니다. 심지어 그런 일이 일어나고 있다는 사실조차 알지 못합니다.

이것이 바로 아무도 이야기하지 않는 'AI 가시성 격차 (AI visibility gap)'입니다.

능력 발현의 속도

Anthropic의 발표에서 가장 중요한 세부 사항 중 하나는 이러한 능력들이 얼마나 빠르게 나타났는가 하는 점입니다.

바로 지난달, Anthropic의 자체 연구원들은 "Opus 4.6은 현재 취약점을 악용하는 것보다 식별하고 수정하는 데 훨씬 더 능숙하다"라고 기술했습니다. 그들의 내부 평가에 따르면 Claude Opus 4.6은 자율적인 익스플로잇 (Exploit) 개발에서 거의 0%에 가까운 성공률을 보였습니다. Mythos Preview는 하룻밤 사이에 그 상황을 바꾸어 놓았습니다.

Anthropic이 Firefox JavaScript 엔진 벤치마크를 다시 실행했을 때 — Opus 4.6이 수백 번의 시도 중 단 두 개의 작동하는 익스플로잇을 만들어냈던 것과 동일한 실험 — Mythos Preview는 181개의 작동하는 익스플로잇을 생성했으며, 추가로 29번의 시도에서 레지스터 제어 (Register control)를 달성했습니다. 이는 단 한 번의 모델 세대 교체만으로 거의 0에 가까운 성능에서 압도적인 성능으로 도약한 것입니다.

Anthropic은 또한 모든 조직이 우려해야 할 점을 언급했습니다. 그들은 이러한 사이버 보안 능력을 위해 Mythos Preview를 명시적으로 훈련시키지 않았다는 것입니다. 해당 기술은 "코드, 추론 (Reasoning), 그리고 자율성 (Autonomy)의 일반적인 개선에 따른 하류 결과 (Downstream consequence)"로 나타났습니다. 모델을 코드를 더 잘 작성하고, 질문에 답하며, 문제에 대해 추론하는 데 더 뛰어나게 만드는 바로 그 개선 사항들이, 시스템을 침입하는 데에도 극적으로 더 뛰어나게 만드는 것입니다.

이는 Anthropic뿐만 아니라 모든 프런티어 랩 (Frontier lab)에서 나오는 차세대 범용 AI 모델들이 유사한 능력을 물려받을 가능성이 높다는 것을 의미합니다. 보안 커뮤니티는 격리할 수 있는 특화된 도구를 상대하고 있는 것이 아닙니다. 모든 프런티어 AI 기업에 걸쳐, 모델 세대가 거듭될 때마다 점점 더 강력해지는 범용적인 능력을 상대하고 있는 것입니다.