본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 15. 07:10

Claude Fable 5: Anthropic이 (제어된 상태로) 괴물을 풀어놓으며 자율 코딩의 수준을 높이다

요약

Anthropic이 강력한 보안 제어 기능이 탑재된 새로운 Mythos-class 모델인 Claude Fable 5를 출시했습니다. 이 모델은 강력한 성능을 제공하면서도 사이버 보안 및 생물학적 위험을 차단하는 통합 보안 분류기를 포함하고 있습니다.

핵심 포인트

  • Anthropic의 첫 번째 대중 공개 Mythos-class 모델 출시
  • 사이버 보안 및 생물학적 위험 방지를 위한 강력한 보안 제어 탑재
  • 기업 가치 9,650억 달러 인정 및 IPO 신청 등 비즈니스 확장세
  • 보안 통제 버전(Fable 5)과 VIP 전용 버전(Mythos 5)의 이원화 운영

Claude Fable 5 - Mythos class model

어제인 2026년 6월 9일, Anthropic은 지금까지 중 가장 강력한 모델을 세상에 내놓았습니다. 이름은 Claude Fable 5이며, 이는 단순히 스테로이드를 맞은 Opus가 아닙니다. 이는 대중에게 공개되는 첫 번째 Mythos-class 모델로, Anthropic이 지난 4월 비밀 모드로 처음 선보였으며 어제 전까지는 오직 엄격한 보안 통제 하에서만 존재했던 카테고리입니다.

이 출시는 작은 글씨(제약 사항)와 함께 찾아왔습니다. 아주 많이 말이죠.

Fable 5는 사슬에 묶인 채 출시되었습니다. 공격적인 사이버 보안(cybersecurity) 쿼리, 이중 용도 생물학(dual-use biology), 모델 증류(model distillation)를 차단하고 이를 Opus 4.8로 자동 리다이렉션하는 통합 보안 분류기(security classifiers)가 탑재되어 있습니다. 이는 마치 페라리를 판매하면서, GPS가 학교 근처라는 것을 감지하면 가속 페달을 스스로 차단하는 것과 같습니다.

이 전략은 야심차면서도 다소 분열적이며, Anthropic이 폭풍의 눈 속에 있는 바로 지금 실행되었습니다. 그들은 막 SEC에 IPO(기업공개) 신청서를 제출했으며, 470억 달러의 매출 실행률(revenue run rate)을 바탕으로 9,650억 달러의 기업 가치를 인정받았습니다. 또한 5일 전에는 AI가 우리의 허가 없이 스스로를 개선하는 법을 배우기 직전이라는 내용을 담은 보고서를 발표했습니다.

모든 일이 동시에 일어나는 해인 2026년에 오신 것을 환영합니다.

Mythos: 자물쇠로 잠가두었던 괴물

2026년 4월, Anthropic은 소프트웨어 취약점을 탐지하고 악용하는 능력이 너무나 강력하여 대중에게 공개하지 않기로 결정한 Mythos 모델을 선보였습니다. 그들은 이를 Project Glasswing이라는 프로그램 아래 소수의 핵심 인프라 기업들에게만 제공했습니다. 그 논거는 다음과 같았습니다: 이 모델이 가진 공격적 해킹(hacking) 능력은 방어 목적이 아닌 누구에게나 허용하기에는 너무나 강력한 무기라는 것이었습니다.

월스트리트는 열광했습니다. CrowdStrike와 Palo Alto Networks는 이를 자신들의 워크플로우에 통합하기 시작했습니다. Mozilla는 이를 활용해 Firefox에서 271개의 버그를 찾아냈습니다. 메시지는 매우 명확했습니다. 레시피를 설명해 주는 챗봇은 잊으십시오. 이것은 차원이 다른 것입니다.

두 달 후, 그들은 공개하기로 결정했습니다. 하지만 조건이 붙었습니다.

Fable 5와 Mythos 5: 서로 다른 삶을 사는 쌍둥이

같은 날 두 모델이 출시되었습니다:

특징Claude Fable 5Claude Mythos 5
사용자당신, 나, API 키가 있는 누구나VIP 클럽 (Project Glasswing) 멤버
.........

동일한 아키텍처(Architecture)를 가졌지만, 권한은 다릅니다. Fable 5는 보험이 포함되어 판매되는 모델인 반면, Mythos 5는 Anthropic이 이미 조사하여 "좋아, 당신은 괜찮아"라고 승인한 이들을 위한 모델입니다.

안전장치: 보호인가, 아니면 구속복인가?

Fable 5는 외부 래퍼(Wrapper)가 아니라 모델 내부에 보안 분류기(Security Classifiers)가 내장되어 있습니다. 모델이 부적절하다고 판단되는 것을 감지하면, 단순히 요청을 거부하고 해당 호출을 Opus 4.8로 넘깁니다.

질문할 수 없는 사항들:

  • 공격적 해킹 (Offensive Hacking) (취약점 악용, 멀웨어 생성)
  • 위험한 생물학 및 화학 (독소, 병원체 합성)
  • 모델 증류 (Model Distillation) (Fable의 응답을 사용하여 다른 모델을 학습시키는 행위)

Anthropic은 이것이 세션의 5% 미만에 영향을 미치며, 1,000시간 이상의 레드팀(Red-teaming) 활동을 수행했음에도 누구도 범용 탈옥(Jailbreak)을 찾아내지 못했다고 말합니다. 또한 분류기가 지나치게 보수적으로 작동한다는 점도 인정했습니다. 시스템이 예방 차원에서 신중함을 택하기 때문에, 완전히 합법적인 일부 질의도 Opus 4.8로 리다이렉트될 수 있습니다.

그리고 논란의 여지가 있는 세부 사항이 하나 있습니다. 바로 30일간의 의무 트래픽 보유(Retention) 정책입니다. 이전 계약에서 데이터 보유 제로(Zero-retention) 정책을 적용받았더라도 마찬가지입니다. Anthropic에 따르면 데이터는 학습에 사용되지 않으며, 오직 "공격으로부터 방어하고 오탐(False Positives)을 줄이기 위해" 사용된다고 합니다. 하지만 이는 불편한 선례를 남깁니다. 더 강력한 성능은 곧 더 적은 프라이버시를 의미하기 때문입니다.

수치 (공식은 아니지만 흥미로운)

Anthropic은 아직 시스템 카드(system card)를 공개하지 않았습니다. 현재 있는 것은 제3자 벤치마크(benchmarks)뿐입니다. 이를 성경처럼 맹신하지 말고 참고용으로만 활용하세요.

벤치마크Claude Fable 5Opus 4.8GPT-5.5Gemini 3.1 Pro
SWE-Bench Pro (에이전틱 코딩 (agentic coding))80.3%69.2%58.6%54.2%
...

SWE-Bench Pro에서 80.3%를 기록했습니다. GPT-5.5보다 20포인트 이상 높습니다. 이것은 점진적인 향상이 아니라, 완전히 다른 리그입니다. 에이전틱 코딩 (agentic coding) 분야에서 Fable 5는 독보적인 존재입니다.

이미 테스트해 본 이들이 전하는 추가적인 성과들:

  • Hex (분석): 분석 작업 벤치마크에서 처음으로 90%를 돌파한 모델입니다. "Opus보다 10포인트 높습니다."
  • Cognition (Devin 개발사): FrontierBench에서 역대 최고 점수를 기록했습니다.
  • CursorBench: 최첨단 (state of the art) 성능을 보여줍니다. "이전 모델들로는 불가능했던 장기적인 문제들을 해결했습니다."
  • Base44 (바이브 코딩 (vibe-coding)): "완성된 앱을 원샷 (one-shot)으로 만들어냅니다. 도구 호출 (tool calling) 능력이 탁월합니다."
  • Hebbia (금융): "우리가 테스트한 금융 분야 모델 중 가장 강력합니다."
  • Rakuten: "최대 성능을 발휘할 때, Fable은 자신의 작업 내용을 스스로 성찰하고 검증합니다. 이러한 추가적인 사고 (thinking) 과정은 그만한 가치가 있습니다."

멈춰야 했던 것 아닌가요?

6월 4일 — Fable 5를 출시하기 5일 전 — Anthropic은 AI 시스템이 인간의 개입 없이 스스로의 후계자를 설계, 구축 및 훈련할 수 있는 징후를 보이고 있다고 경고하는 보고서를 발표했습니다. 그들은 이를 재귀적 자기 개선 (Recursive Self-Improvement, RSI)이라고 부릅니다.

동일한 보고서는 모든 대형 연구소(laboratories)에 프런티어 모델 (frontier models) 개발에 대해 "조율되고 검증 가능한 제동 장치"를 마련할 것을 요구하고 있습니다. Dario Amodei는 몇 달째 같은 말을 반복하고 있습니다. 행동할 수 있는 창이 닫히고 있다는 것입니다.

이러한 모순은 명백하며, Anthropic에는 다음과 같은 질문들이 쏟아지고 있습니다. "글로벌 일시 중단을 요구하면서 동시에 시장에서 가장 강력한 모델을 출시하는 이유가 무엇입니까?" 제품 책임자(head de producto)인 Diane Penn의 답변은 "상향 경쟁 (race to the top)"입니다. 강력한 안전장치 (safeguards)를 갖춘 채 강력한 기술을 출시하는 것이, 기준이 없는 누군가가 그 빈자리를 차지하도록 내버려 두는 것보다 낫다는 것입니다.

이 논리가 받아들여질지는 여러분의 판단에 달려 있습니다.

Plata: Opus의 두 배 가격

Input (1M tokens)Output (1M tokens)
Claude Fable 5$10.00$50.00
Claude Opus 4.8$5.00$25.0

미국 서버에서만 추론 (inference)을 원하시나요? 10% 추가 비용이 발생합니다.

6월 22일까지는 Pro, Max, Team 및 Enterprise 구독자가 추가 비용 없이 사용할 수 있습니다. 23일부터는 비용을 직접 부담해야 합니다.

Penn은 Fable이 더 적은 시도 (attempts)를 필요로 하기 때문에 작업당 최종 비용은 더 낮다고 주장합니다. "더 똑똑한 모델을 사용하면 단순히 ROI (투자 대비 수익)가 더 높습니다." 알겠습니다, Diane. 6월 청구서를 지켜보도록 하죠.

도대체 어디에 쓰는 물건인가?

에이전트 (Agents). Claude Code나 관리형 에이전트 (Managed Agents)에 탑재된 Fable 5는 감독 없이 며칠 동안 작업할 수 있습니다. 단계별로 계획을 세우고, 하위 에이전트 (subagents)에게 업무를 위임하며, 자신의 출력물 (output)을 스스로 검토합니다. 이것은 코파일럿 (copilot)이 아닙니다. 프로젝트를 맡겨두고 완료되면 다시 돌아오면 되는 직원입니다.

코딩 (Coding). 대규모 마이그레이션 (migrations), 복잡한 구현, 이전에는 팀 전체가 필요했던 리팩토링 (refactors) 작업을 수행합니다. 스스로 테스트 코드를 작성하고, 높은 충실도로 설계를 구현하며, 시각 기능 (vision)을 사용하여 자신이 수행한 작업과 요청 사항을 비교합니다.

엔터프라이즈 (Enterprise). 심층 조사, 문서 분석, 검토 준비가 완료된 결과물을 생성합니다. 산더미 같은 PDF 파일을 전달하면 보고서를 돌려줍니다. 감독하는 것이 아니라, 검토하는 것입니다.

시각 기능 (Vision). PDF 내의 다이어그램, 표, 중첩된 그래프를 읽습니다. 또한 시각 기능을 사용하여 자신의 코드를 점검합니다. 주요 시장은 금융, 법률, 분석, 건축 분야입니다.

당신에게 유용한가?

일상적인 업무를 위해서는 Opus 4.8이나 Gemini 3.5 Flash와 같은 빠른 모델을 사용하십시오. 더 저렴하고, 더 빠르며, 문제를 해결해 줍니다.

Fable 5는 문제가 정말로 까다롭고 길어질 때를 위한 것입니다. 몇 시간씩 걸리는 자율적인 리팩토링 (refactors), 체인형 에이전트 (chained agents), 그리고 Opus 4.8조차 손을 들고 포기해 버리는 작업들이 이에 해당합니다. 백만 토큰당 $10/$50의 비용이 들기 때문에 기본 모델은 아니지만, 출력 품질이 그 비용을 정당화할 때 사용하는 당신의 비밀 병기입니다.

만약 당신의 프로젝트가 공격적 사이버 보안 (offensive cybersecurity)이나 합성 생물학 (synthetic biology)에 조금이라도 발을 걸치고 있다면, Opus 4.8이 절반 정도의 확률로만 제대로 답변할 것이라고 가정하십시오.

전체 판도

Fable 5는 평온한 날에 등장하지 않았습니다:

  • OpenAI는 8,520억 달러의 가치로 비밀 상장 (IPO)을 추진했습니다.
  • SpaceX/xAI가 이번 주 금요일에 상장합니다.
  • Google은 Gemini 3.5 Flash를 빠르고 저렴한 경주마로 내세웠습니다.
  • GPT-5.5 Pro는 수학과 일반 지식 분야에서 경쟁하고 있지만, 에이전트형 코딩 (coding agéntico) 수치는 공개조차 하지 않았습니다.

Fable 5는 오늘날 자율 코딩의 왕입니다. 하지만 이 왕좌는 매달 움직입니다.

요약하자면

Claude Fable 5는 야심 차고 비싸며, Anthropic의 이전 어떤 모델보다 더 많은 제한 사항을 가지고 출시되었습니다. 또한 현재 공개된 수치들을 볼 때, 현시점 가장 강력한 에이전트형 코딩 (coding agéntico) 모델입니다.

Anthropic은 "이것은 위험하므로 규제해야 한다"와 "자, 가져가서 지금 바로 구매하고 사용하라" 사이에서 아슬아슬한 줄타기를 하고 있습니다. 만약 이 전략이 성공한다면, Fable 5는 Mythos-class 모델들이 기업의 비밀에서 벗어나 실제 업무 도구로 변모하는 순간이 될 것입니다. 만약 실패한다면, 보안 안전장치 (safeguards)가 너무 일찍 도입되었는지 혹은 너무 늦게 도입되었는지를 보여주는 완벽한 사례 연구가 될 것입니다.

한 가지 확실한 것은 자율 코딩의 기준이 방금 또 한 번 높아졌다는 사실입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0