본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 10. 13:01

Claude Fable 5란 무엇인가? ── 「Mythos가 일반 공개된 날」에 무엇이 바뀌었는지 완벽 이해하기

요약

Anthropic이 출시한 Mythos 클래스 기반의 Claude Fable 5 모델에 대해 상세히 분석합니다. Fable과 Mythos 모델의 차이점인 세이프가드 메커니즘과 API 구현 시 주의해야 할 기술적 사항을 다룹니다.

핵심 포인트

  • Fable 5와 Mythos 5는 동일한 기반 모델이나 세이프가드 유무로 구분됨
  • 세이프가드 작동 시 Opus 4.8로 자동 전환되는 동작 주의 필요
  • API 구현 시 거절 상태 코드 및 과금 처리 방식 확인 필수
  • 대규모 리팩토링 및 장기 에이전트 태스크 활용 가능성 제시
  • Claude Fable 5의 발표를 보고 「Mythos 클래스란 도대체 무엇인가?」라고 생각한 사람

  • API/Claude Code에서 실제로 사용하기 위해 요금, 컨텍스트 길이(Context Length), 모델 ID를 알고 싶은 개발자

  • claude-fable-5의 「세이프가드(Safeguard)로 인해 Opus 4.8로 전환되는」 동작이 업무에 미칠 영향을 가늠하고 싶은 엔지니어

  • 대규모 태스크(며칠이 걸리는 리팩토링, 장기 에이전트)에 AI를 사용할 계획이 있는 사람

  • Fable 5와 Mythos 5가 「같은 모델」인 이유와 그 경계선

  • 세이프가드(분류기)가 작동했을 때 발생하는 정확한 동작

  • API 구현 시 빠지기 쉬운 함정(거절(Refusal) 시의 상태 코드, 과금 처리, 폴백(Fallback))

  • 구독/API 제공 스케줄과 6/23 「무료 기간 종료」라는 함정

  • 벤치마크 스코어의 상세 비교 (공식 시스템 카드(System Card)에 맡김)

  • Mythos 5 자체의 사용법 (일반 제공되지 않으므로 검증 불가능)

  • 생물·화학·사이버 분야에서의 구체적인 이용 방법 (후술하겠지만, 애초에 응답이 차단됨)

먼저 결론부터 말하자. 2026년 6월 9일, Anthropic은 Claude Fable 5를 일반 공개했다. 이는 Opus 클래스 위에 위치하는 「Mythos 클래스」를 처음으로 누구나 사용할 수 있는 형태로 내놓았다는 점에서 분기점이 되는 사건이다.

이 기사에서는 일관되게 「잠긴 방」이라는 비유를 사용하여 이야기를 진행한다. 이해를 돕기 위한 지도로 삼아주길 바란다.

  • Mythos 클래스 = 방 그 자체. 안에는 극도로 강력한 능력이 놓여 있음
  • Claude Mythos Preview (4월 공개) = 방에 들어갈 수 있는 것은 선택된 소수뿐. 열쇠를 가진 자는 Project Glasswing의 사이버 방위 파트너뿐임
  • Claude Fable 5 (이번 발표) = 같은 방에 누구나 들어올 수 있게 됨. 단, 「위험한 선반」 앞에는 자동 셔터가 내려감
  • Claude Mythos 5 (이번 발표) = 셔터가 없는 방. 계속해서 열쇠를 가진 자만이 들어갈 수 있음

Anthropic의 공식 발표 원문은 다음과 같다.

Today we’re launching Claude Fable 5: a Mythos-class model that we’ve made safe for general use.

(번역: 오늘 우리는 Claude Fable 5를 출시합니다. 이는 우리가 일반 이용을 위해 안전하게 만든 Mythos 클래스 모델입니다)

출처:

즉, Fable과 Mythos는 능력 면에서는 **같은 방 = 같은 기반 모델(Foundation Model)**에 있다. 차이점은 셔터(세이프가드)가 있느냐 없느냐, 단지 그것뿐이다. 공식 각주가 이 명칭의 이유를 밝히고 있다.

Fable is from the Latin

fabula, “that which is told,” akin to the Greek mythos. The safeguards are what distinguish the two models (Fable and Mythos) and are why we’ve given them different names.

(번역: Fable은 라틴어 fabula 「이야기되는 것」에서 유래했으며, 그리스어 mythos와 유사하다. 두 모델(Fable과 Mythos)을 구별하는 것은 세이프가드이며, 이것이 우리가 서로 다른 이름을 붙인 이유이다)

여기까지로 「Fable과 Mythos의 관계」라는 지도를 얻었다. 다음은 그 지도 위에서 가장 중요한 「셔터의 메커니즘」을 살펴보겠다.

Fable 5를 논할 때 피할 수 없는 것이 바로 이 세이프가드의 동작이다. 이 부분을 오해한 채 업무에 도입하면, 나중에 「왜인지 동작이 변한다」며 혼란을 겪게 된다.

보통 AI 모델이 위험한 요청을 거절할 때는 「답변할 수 없습니다」라고 거절(refusal)한다. Fable 5는 이 점이 다르다. 위험하다고 판단된 요청은 자동으로 Opus 4.8이 대신 응답한다. 비유하자면, 위험한 선반 앞에 셔터가 내려가면 그 자리에 대기하고 있던 차석 스태프 = Opus 4.8이 대신 접객에 나서는 이미지다.

Fable의 분류기 (classifier)가 사이버 보안, 생물학 및 화학, 또는 증류 (distillation)와 관련된 요청을 감지하면, 응답은 자동으로 대신 Claude Opus 4.8에 의해 처리됩니다. 이러한 상황이 발생할 때마다 사용자에게는 알림이 제공됩니다.

(번역: Fable의 분류기가 사이버 보안, 생물·화학, 또는 증류와 관련된 요청을 감지하면, 응답은 자동으로 Claude Opus 4.8에 의해 처리된다. 이것이 발생할 경우, 사용자에게는 반드시 통지된다)

공식 측은 이를 "거절당하는 것보다 훨씬 나은 경험"이라고 정의하고 있습니다.

Opus 4.8은 그 자체로 매우 유능한 모델입니다. Opus로 폴백 (fallback)되는 것이 Fable로부터의 완전한 거부보다 훨씬 더 나은 경험입니다.

(번역: Opus 4.8은 그 자체로 매우 고성능 모델이다. Opus로의 폴백은 Fable로부터의 완전한 거부보다 훨씬 더 좋은 경험이다)

분류기가 커버하는 영역은 다음 3가지 영역입니다.

영역차단하는 이유동작
사이버 보안취약점 발견 및 악용, 에이전트형 해킹으로의 "역량 강화"를 방지하기 위해Opus 4.8로 폴백
...

이 부분이 가장 중요하므로 강조해 두겠습니다. Anthropic은 "안전한 쪽으로 기울기 위해, 세이프가드 (safeguard)를 의도적으로 엄격하게 튜닝했다"고 명시했습니다. 즉, 무해한 요청이라도 셔터가 내려갈 수 있습니다.

그들은 때때로 무해한 요청도 포착하곤 하지만, 평균적으로 세션의 5% 미만에서 트리거 (trigger)됩니다.

(번역: 그것들은 때때로 무해한 요청도 포착하지만, 발화하는 것은 평균적으로 세션의 5% 미만이다)

당신이 작성한 코드에 우연히 보안 관련 키워드나 암호 처리 (cryptography)가 포함되어 있다면, Fable 5가 아닌 Opus 4.8이 응답할 가능성이 있습니다. "Fable인 줄 알았는데 Opus였다"라는 현상은 확률이 5% 미만이라 할지라도 확실히 발생합니다. 재현성이 필요한 업무에서는 이 전제를 바탕으로 테스트 설계를 해야 합니다.

역으로 말하면, 95% 이상의 세션에서는 폴백이 전혀 발생하지 않으며, 그동안은 Mythos 5와 실질적으로 동일한 성능을 얻을 수 있습니다.

초기 데이터에 따르면 Fable 세션의 95% 이상은 폴백을 전혀 포함하지 않습니다. 해당 세션들에서 Fable 5의 성능은 실질적으로 Mythos 5와 동일합니다.

(번역: 초기 데이터에서는 Fable 세션의 95% 이상이 폴백을 전혀 수반하지 않는다. 그러한 세션에서 Fable 5의 성능은 실질적으로 Mythos 5와 같다)

세이프가드라는 "셔터"의 메커니즘을 이해했으니, 다음으로는 이것을 실제로 API로 호출했을 때 무엇이 반환되는지 살펴보겠습니다. 이 부분을 모르면 실무(production)에서 낭패를 볼 수 있습니다.

여기서부터는 API를 실제로 사용하는 개발자를 위한 실무 정보입니다. 공식 문서로부터 빠지기 쉬운 함정들을 차례대로 제거해 나가겠습니다.

첫 번째 함정은 이것입니다. Fable 5가 요청을 거부했을 때, Messages API는 에러가 아니라 성공으로 간주되는 HTTP 200을 반환합니다.

Claude Fable 5가 요청을 거절할 때, Messages API는 에러가 아니라 성공적인 HTTP 200 응답으로서 stop_reason: "refusal"을 반환합니다.

(번역: Claude Fable 5가 요청을 거부할 때, Messages API는 에러가 아니라 성공한 HTTP 200 응답으로서 stop_reason: "refusal"을 반환한다)

try/except 구문으로 HTTP 에러만 잡아내는 구현을 사용한다면, 거부(refusal)를 놓치게 됩니다. 반드시 stop_reason의 값을 체크해야 합니다. 어떤 분류기가 거부했는지도 응답에 포함되어 있습니다.

「Opus 4.8으로 자동 강등된다」라고 썼지만, 이는 Claude.ai나 Claude Code와 같은 앱 표면에서의 이야기입니다. 생(raw) API에서는 폴백(fallback)을 직접 구현해야 합니다 (fallbacks 파라미터 또는 SDK 미들웨어 경유).

사소하지만 중요합니다. 출력이 생성되기 전에 거부된 요청은 과금되지 않습니다. 다른 모델로 재시도(retry)할 경우, 프롬프트 캐시(prompt cache) 전환 비용은 '폴백 크레딧(fallback credits)'으로 환급됩니다.

You are not billed for a request that is refused before any output is generated.

(번역: 출력이 생성되기 전에 거부된 요청에 대해서는 과금되지 않습니다)

출처 (API 동작 전반):

거부(refusal) 판정과 폴백의 골격을 책임을 나누어 작성하면 다음과 같습니다. 실제 SDK 사양은 공식 문서를 따라야 하지만, 설계의 핵심은 이 분리에 있습니다.

클릭하여 샘플 코드(Python·의사 구현) 펼치기

"""
Fable 5의 refusal/fallback을 다루는 최소 구성.
- 「판정」과 「폴백 실행」의 책임을 분리 (관심사의 분리)
...

여기까지로 '구현하는 측'의 준비는 끝났습니다. 다음은 그 구현을 언제, 어떤 플랜으로 실행할 수 있는지에 대한 제공 조건을 확인합니다. 스펙과 일정을 혼동하면 품의와 견적 모두 무너집니다.

항목Claude Fable 5Claude Mythos 5
API 모델 IDclaude-fable-5claude-mythos-5
위치 선정일반 제공되는 최상위 모델Fable에서 세이프가드(safeguard)를 제거한 동일 기반 모델
컨텍스트 길이 (Context Length)100만 토큰 (기본값)100만 토큰 (기본값)
최대 출력1 요청당 12.8만 토큰좌동
...

요금의 $10 / $50 (100만 토큰당 입력/출력)은, Claude Mythos Preview의 절반 미만이라고 공식 측에서 밝히고 있습니다. 프롬프트 캐시에는 기존의 입력 토큰 90% 할인이 계속 적용됩니다.

Fable 5 / Mythos 5에서는 「적응적 사고 (adaptive thinking)」가 항상 ON 상태이며, 이것이 유일한 사고 모드입니다. thinking: {"type": "disabled"}지원되지 않습니다. 사고의 깊이는 effort 파라미터로 제어합니다. 또한, 생(raw) 사고 과정 (raw chain of thought)은 반환되지 않습니다 (omitted가 기본값이며, summarized를 지정하면 요약본을 얻을 수 있습니다).

이전 모델에서 이식할 때, 이 점을 전제로 했던 코드는 확실히 동작이 변하게 됩니다.

이는 법무·컴플라이언스(compliance) 관점에서 간과할 수 없는 부분입니다. Fable 5·Mythos 5는 「Covered Models」로 지정되어, 모든 트래픽에 대해 30일간의 데이터 보유가 필수 사항이 되었습니다. 제로 데이터 보유 (ZDR, Zero Data Retention) 계약에서는 사용할 수 없습니다.

We will require 30-day retention for all traffic on Mythos-class models, on both first- and third-party surfaces. We won’t use this data to train new Claude models, or for any non-safety-related purpose.

(번역: Mythos 클래스 모델에서는 퍼스트 파티 및 서드 파티 환경 모두에서 모든 트래픽에 대해 30일간의 보유를 필수적으로 요구합니다. 이 데이터를 새로운 Claude 모델을 학습시키거나, 안전과 관련되지 않은 목적으로 사용하지는 않습니다)

숫자와 스펙을 파악했으니, 마지막으로 「언제 사용할 수 있는가」라는 시간축에 대해 이야기하겠습니다. 여기에 이번의 가장 큰 함정이 있습니다.

API와 종량제(pay-as-you-go) Enterprise에서는 오늘부터 완전히 사용할 수 있습니다. 문제는 구독 플랜입니다. Anthropic은 수요 예측의 어려움 때문에 단계적인 롤아웃(rollout)을 선택했습니다.

6월 23일에 Pro/Max/Team/seat형 Enterprise 플랜에서 Fable 5가 일단 제외됩니다. 그 이후의 이용에는 사용량 크레딧(usage credits)이 필요합니다. 「무료로 쓸 수 있어서 운영 환경에 포함시켰다」는 계획이 6/23에 갑자기 무너질 가능성이 있습니다. 구독을 전제로 운영 설계를 하고 있다면 주의가 필요합니다. 용량에 여유가 생기는 대로 표준 기능으로 복구할 방침이라고 합니다.

오늘부터 6월 22일까지, Fable 5는 Pro, Max, Team, 그리고 시트 기반(seat-based) Enterprise 플랜에 추가 비용 없이 포함됩니다. 6월 23일에는 해당 플랜들에서 Fable 5를 제외할 예정입니다.

(번역: 오늘부터 6월 22일까지, Fable 5는 Pro, Max, Team, 시트형 Enterprise 플랜에 추가 비용 없이 포함된다. 6월 23일에, 이 플랜들에서 Fable 5를 삭제한다)

참고로, 이 글을 작성하고 있는 시점은 공개 당일(일본 시간 6/10)이며, 위 일정은 향후 변경될 수 있습니다. 최신 정보는 반드시 1차 정보를 확인하시기 바랍니다.

의문 사항 · 증상답변 · 대처
Fable을 지정했는데 Opus와 유사한 응답이 돌아옴세이프가드 (Safeguard)의 폴백 (Fallback)이 작동했을 가능성. 응답 알림과 어떤 분류기 (Classifier)가 반응했는지 확인
stop_reason: "refusal"이 왔으나 에러가 발생하지 않음사양대로임. 거절은 성공 처리되는 HTTP 200. stop_reason으로 분기하는 구현을 할 것
거절된 부분에 대한 요금이 걱정됨출력 생성 전의 거절은 과금되지 않음. 재시도 시의 캐시 전환분은 폴백 크레딧 (Fallback credit)으로 환급
thinking: disabled를 지정했더니 에러 발생Fable/Mythos에서는 비활성화 불가. 적응형 사고 (Adaptive thinking)가 상시 ON 상태임. 깊이는 effort로 조정
가공되지 않은 사고 과정 (Raw thinking process)이 빈 값으로 반환됨사양임. 기본값이 omitted임. 요약이 필요하다면 display: "summarized" 사용
ZDR (Zero Data Retention, 제로 데이터 보유) 계약 시 사용 불가Covered Model 지정 때문에 30일 데이터 보유가 필수임. ZDR에서는 이용 불가
구독 중에는 사용할 수 있었는데 6/23 이후 사용할 수 없음일정에 따른 제외. 사용 크레딧 (Usage credits)이 필요함
Mythos 5를 사용하고 싶음일반 제공 없음. Project Glasswing 승인이 필요함. 일반 사용자는 Fable 5를 사용함

공식 측에서 반복해서 강조하는 점은 "태스크가 길고 복잡해질수록 Fable 5의 우위가 커진다"는 것입니다. 초기 테스터들의 목소리를 바탕으로 적합한 용도를 정리해 보겠습니다.

Stripe의 초기 테스트에서는 5,000만 행의 Ruby 코드베이스 전체를 이전하는 작업을 단 하루 만에 완료했습니다. 수작업으로 진행했다면 팀 단위로 2개월 이상 소요되었을 규모입니다.

In a 50-million-line Ruby codebase, the model performed a codebase-wide migration in a day that would otherwise have taken a whole team over two months by hand.

(번역: 5,000만 행의 Ruby 코드베이스에서, 이 모델은 수작업이라면 팀이 2개월 이상 걸렸을 코드베이스 전체 이전을 하루 만에 수행했다)

반대로, 짧고 단발적인 태스크나 세이프가드에 걸리는 영역에서는 Fable 5를 선택하는 이점이 적습니다. 전자는 Opus 4.8이나 Sonnet으로도 충분하며, 후자는 애초에 Opus 4.8로 강등(downgrade)됩니다. "최강이니까 무엇이든 사용한다"는 전략은 100만 출력 토큰당 $50라는 가격을 고려할 때 현명하지 못한 선택입니다.

Fable 5를 기점으로 Anthropic의 모델과 AI 기반 기술에 대한 이해를 넓히고 싶다면, 다음 순서를 추천합니다.

  • LLM의 기초 ── 애초에 대규모 언어 모델 (Large Language Model)이란 무엇인가

  • Transformer / Self-Attention ── Fable의 토대로 있는 메커니즘

  • API의 기본 ── Messages API를 호출하기 위한 전제 지식

  • MCP ── 장기 에이전트 (Long-term agent)가 외부 도구와 통신하는 메커니즘

  • ClaudeMythos ── 이번 Fable의 "셔터 없는 버전"의 전신

  • 세이프가드/분류기의 개념 ── 왜 강등 방식을 채택하는가

  • 30일 데이터 보유와 Covered Model의 법무적 영향력

  • Claude Fable 5는,
    Opus를 상회하는 Mythos 클래스를 처음으로 일반 공개한 모델이다. Fable과 Mythos 5는 동일한 기반 모델 (Foundation Model)이며, 차이점은 세이프가드 (Safeguard)의 유무뿐이다. 위험 영역 (사이버/생물·화학/증류)에 대한 요청은
    **거부 (Refusal)가 아니라 Opus 4.8로 강등 (Downgrade)**된다. 발화 (Trigger)율은 평균 5% 미만이지만, 무해한 요청도 휘말릴 수 있다. API 구현 시에는,
    거부는 HTTP 200으로 반환 · 출력 전 거부는 과금되지 않음 · 사고 과정 (Reasoning)은 항상 ON 상태이며 가공되지 않은 사고 과정은 반환되지 않음이라는 세 가지 포인트를 숙지해야 한다. 요금은 $10/$50 (입력/출력 · 100만 토큰당), 컨텍스트 (Context) 100만 토큰, 출력 12.8만 토큰, 30일 데이터 보유가 필수적이다.

  • 구독 서비스는
    6/23에 일단 철거 후 usage credits (사용 크레딧)로 전환되는 단계적 롤아웃 (Rollout) 방식이다. 무료를 전제로 한 실무 적용 시 주의가 필요하다.

마지막으로 개인적인 소감이다. Mythos가 4월에 '잠긴 방'의 형태로 등장했을 때, 솔직히 '일반인과는 거리가 먼 이야기구나'라고 생각했다. 그런데 불과 2개월 만에, 셔터가 내려져 있긴 하지만 일반 공개까지 이르렀다. '강등'이라는 아이디어는 수수하지만 영리하다고 생각한다. 거부를 당하면 경험이 끊기지만, Opus 4.8이라는 매우 우수한 차석이 대기하고 있다면 사용자는 거의 불편함을 느끼지 않는다. 안전과 편의성의 트레이드오프 (Trade-off)를 이분법적 선택이 아닌 '단차'로 해결한 셈이다. 다만 5% 미만이라고는 해도 무해한 요청까지 휘말리는 현 상황은, 사용자 입장에서 솔직히 염두에 두어야 한다. 웃고 있을 때가 아니다, 이것은 실무에서 확실히 밟을 수 있는(;゚д゚) 멍해지는 상황이다.

공식 발표:

API 문서 (모델 ID · 요금 · 거부 동작):

Project Glasswing:

필자의 X(구 트위터)도 괜찮다면 방문해 주세요. 최신 AI · GPU · 로컬 LLM 소식을 발신하고 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0