Anthropic의 강력한 Mythos AI, 레드팀 테스트 중 몇 시간 만에 NSA의 거의 모든 기밀 시스템을 침투했다고 보고됨 — 미국

요약

Anthropic의 Mythos AI가 레드팀 테스트 중 NSA의 기밀 시스템을 침투했다는 논란이 발생했으나, 이는 통제된 시뮬레이션 환경 내에서의 보안 평가 결과로 밝혀졌습니다. 미국 정부는 AI 모델에 대한 직접적인 수출 통제를 적용하며 보안 우려를 표명했습니다.

핵심 포인트

Mythos AI가 레드팀 테스트 중 단 몇 시간 만에 NSA 시스템 침투 시뮬레이션 성공
미국 정부가 AI 모델 자체에 대해 직접적인 수출 통제를 적용한 첫 사례 발생
Anthropic은 해당 현상이 특정 조건에서의 국소적 탈옥(jailbreak)이라고 설명
보안 우려로 인해 외국 국적자의 특정 모델 접근이 제한됨

지난주 The Economist의 보고서에 따르면, Anthropic의 강력한 Mythos AI 모델이 통제된 보안 평가(security evaluation) 도중 몇 시간 만에 미국 정부에서 가장 높은 서열과 강력한 권한을 가진 정보 기관 중 하나인 국가안보국(NSA) 소속의 "거의 모든" 기밀 시스템에 침투할 수 있었던 것으로 나타났습니다. 이 주장은 상원 정보위원회 부위원장인 Mark Warner 상원의원으로부터 나왔으며, 그는 NSA 및 미국 사이버사령부(U.S. Cyber Command)의 수장인 Joshua Rudd 장군으로부터 해당 모델의 능력에 대해 브리핑을 받았다고 밝혔습니다.

처음에는 주목받지 못했던 6월 14일자 보고서에서 [The Economist]가 인용한 바에 따르면, Rudd 장군은 Warner 의원에게 "(이 도구는) 우리의 기밀 시스템 거의 전체를 침투했습니다. 몇 주가 아니라 단 몇 시간 만에 말입니다"라고 말했다고 합니다. 이 인용구는 약 일주일 후 여러 소셜 미디어 플랫폼을 통해 빠르게 퍼지며 Anthropic의 모델이 "NSA를 해킹했다"는 주장을 생성했습니다. 이에 대응하여, 원문 작성자는 어제인 21일에 해당 서사가 사실이 아님을 명확히 하는 공개 성명을 발표했습니다. 해당 침투는 Mythos가 매우 구체적인 시뮬레이션 환경 조건 하에서 다른 방어 도구들과 함께 사용된 승인된 내부 레드팀 테스트(red-team test) 중에 발생했습니다.

이 이야기는 국가 안보 우려를 이유로 Anthropic의 비시민권자 직원을 포함한 모든 외국 국적자가 Fable 5 및 Mythos 5 모델에 접근하는 것을 금지한 6월 12일 자 미국 정부 지침에 대해 밝혀내고 있습니다. Anthropic은 시스템을 모든 사용자로부터 회수하지 않고서는 국적 기반의 접근 제한을 실질적으로 강제할 수 없다고 밝히며, 전 세계적으로 해당 모델들의 사용을 중단하는 것으로 대응했습니다.

당시 정부는 이번 조치에 대한 상세한 공개 증거를 제공하지 않았으며, 이는 미국이 AI를 구동하는 하드웨어가 아닌 AI 모델 자체에 직접적으로 수출 통제 (export controls)를 적용한 첫 사례가 되었습니다. Anthropic은 수령한 서신에 근본적인 우려 사항이 명시되지 않았으며, Fable 5가 소프트웨어 취약점 (software vulnerabilities)을 식별할 수 있게 하는 "잠재적이고 국소적인 비보편적 탈옥 (potential narrow, non-universal jailbreak)"에 대한 구두 증거만을 전달받았다고 말했습니다.

Rudd의 인용구는 이제 누락되었던 맥락을 제공하는 것으로 보입니다. 보안 평가(security evaluation)는 금지 조치가 내려진 12일의 하루 전인 6월 11일에 수행되었습니다. Anthropic은 언급된 침해 사례가 OpenAI의 GPT-5.5를 포함한 경쟁 모델들도 보이는 국소적인 탈옥 (jailbreak)이라고 주장합니다. 회사 측에 따르면, 문제가 된 동작은 모델에게 코드베이스 (codebase)를 분석하고 식별된 문제를 수정하도록 요청한 것에 불과했으며, 이는 진정한 자율적 공격 침투 (autonomous offensive intrusion)라기보다는 이미 알려진 몇 가지 사소한 버그를 드러낸 수준이었다고 합니다. 회사는 현재 접근 권한을 복구하기 위해 노력하고 있으며, 백악관과 협력적인 리스크 관리 프레임워크 (risk-management framework)를 준비하고 있다고 밝혔습니다.

ClaudeAI subreddit에서의 대중적 반응은 대략 세 가지 진영으로 나뉘는 것으로 보입니다. 대다수는 정부의 사이버 보안 (cybersecurity)에 대한 기소장으로 이 사건을 보고 있으며, 필요한 수준의 인재를 채용하지 못하는 무능함과 과거의 정보 유출 이력을 그 근거로 듭니다. 두 번째로 큰 그룹은 해당 주장에 회의적이며, 이를 선정적이거나 심지어 Anthropic의 마케팅 수법으로 간주합니다. 이 그룹은 소위 침입이라고 주장되는 사건에 대한 세부 정보가 부족하다는 점을 지적하며, NSA 국장의 기술적 전문성에 의문을 제기합니다. 소수의 의견은 회의론자들에게 반박하며, 관찰자들이 AI 능력의 기하급수적인 성장을 과소평가하고 있다고 주장합니다. 이들은 AI가 공격 타임라인을 몇 시간에서 몇 분으로 단축시켰으며, 잘 관리되는 오픈 소스 (open-source) 프로젝트들조차 수많은 취약점 (vulnerabilities)이 드러나고 있다는 사이버 보안 전문가들의 주장을 인용합니다.

이러한 논쟁과 광범위한 제한 조치에도 불구하고, Anthropic은 자사의 Project Glasswing 프로그램 내 특수 계약에 따라 NSA와 긴밀히 협력을 계속하고 있습니다. Financial Times는 지난 6월 초, 약 6명의 Anthropic 엔지니어들이 전방 배치된 직원 (forward-deployed staff)으로서 기관 내부에 직접 배치되어 특정 작전 응용 분야에 맞춰 Mythos를 조정 및 맞춤화하고 있다고 보도했습니다. 소식통들은 이 작업이 중국과 이란을 포함한 국가들이 운영하는 네트워크를 침투하는 것까지 확장될 수 있음을 시사하고 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Anthropic의 강력한 Mythos AI, 레드팀 테스트 중 몇 시간 만에 NSA의 거의 모든 기밀 시스템을 침투했다고 보고됨 — 미국

요약

핵심 포인트

댓글