Anthropic이 'Claude Fable 5'를 GA 발표 — 1M 컨텍스트, $10/$50, 그리고 '거절(refusal)이 정상 - Insights | Molayo

2026년 6월 9일, Anthropic이 Claude Fable 5(claude-fable-5)와 Claude Mythos 5(claude-mythos-5)를 발표했다. 주목해야 할 점은 성능 수치만이 아니다. "최상위 모델을 안전 분류기(safety classifier)와 함께 일반 제공(GA)하고, 분류기에 걸린 요청은 다른 모델로 폴백(fallback)시킨다"는, 기존의 LLM API에는 없었던 계약 방식이 Messages API에 도입되었다는 점이다. 본문의 사실 관계는 모두 아래의 1차 소스를 바탕으로 한다.

발표 블로그: https://www.anthropic.com/news/claude-fable-5-mythos-5
제품 페이지: https://www.anthropic.com/claude/fable
모델 사양: https://platform.claude.com/docs/en/about-claude/models/overview
API 변경 사항: https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5

Anthropic은 이번에 동일한 능력을 가진 두 가지 모델을 동시에 출시했다.

Claude Fable 5는 "Mythos급 모델을 일반 이용을 위해 안전화한 것(a Mythos-class model that we've made safe for general use)"이라고 설명되는, 동사의 최상위 일반 제공 모델이다. 6월 9일부터 Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI, Microsoft Foundry에서 일반 제공(GA)이 시작되었다.

Claude Mythos 5는 동일한 모델에서 일부 영역의 안전 분류기를 제거한 것으로, Project Glasswing의 승인된 고객에게만 한정 제공된다. 일반 개발자가 접할 수 있는 것은 Fable 5 쪽이다.

성능 면에서는 "테스트한 거의 모든 벤치마크에서 state-of-the-art(SOTA)"라고 주장하며, Cognition의 FrontierCode에서 "medium effort에서도 프론티어 모델 중 최고 점수", Hebbia의 Finance Benchmark에서 모든 모델 중 최고, 자사의 핵심 분석 벤치마크에서 처음으로 90%를 넘어서는 성과를 거두었다. Stripe는 "통상적으로 팀이 2개월 이상 걸릴 코드베이스 전체 마이그레이션을 하루 만에 완료했다"라고 언급했다 (이는 고객의 증언이며, 재현 가능한 측정값이 아니라는 점에는 유의해야 한다).

6월 9일~22일은 Pro/Max/Team/Enterprise 플랜에서 추가 비용 없이 사용할 수 있으며, 6월 23일 이후부터는 이용 크레딧이 필요하다.

사양의 요점을 공식 문서에서 추출하면 다음과 같다:

컨텍스트 윈도우 (Context Window): 기본 1M 토큰. 최대 출력은 128k 토큰
가격: 입력 $10 / 출력 $50 (per MTok). Opus 4.8($5/$25)의 정확히 2배. 프롬프트 캐싱 (Prompt Caching) 적용 시 입력 비용 90% 할인
토크나이저 (Tokenizer): Opus 4.7에서 도입된 새로운 토크나이저를 사용. 이전 모델 대비 "동일한 텍스트가 약 30% 더 많은 토큰 수로 계산된다"라고 명시되어 있어, 비용 산정 시 주의가 필요함
사고 모드 (Thinking Mode): Adaptive thinking이 항상 켜져 있으며, 이것이 유일한 사고 모드임. thinking: {"type": "disabled"}는 지원되지 않음. 사고의 깊이는 effort 파라미터로 제어함
Raw CoT(Chain of Thought)는 반환하지 않음: thinking.display의 기본값은 "omitted" (빈 사고 블록이 반환됨). "summarized"를 지정하면 요약된 사고를 읽을 수 있음. 가공되지 않은 raw chain of thought는 전혀 반환되지 않음

그리고 이번에 가장 흥미로운 점은 refusal(거절)과 fallback(폴백)의 API 계약이다. Fable 5에는 사이버 보안, 생물·화학, 모델 증류(model distillation)의 3개 영역에 안전 분류기가 포함되어 있어, 해당 요청은 거절된다. 이때:

Messages API는 에러가 아니라 HTTP 200의 정상 응답으로서, 어떤 분류기가 거절했는지도 응답에 포함되는 stop_reason: "refusal"을 반환한다.
fallbacks

파라미터(베타)를 전달하면, 거절(refusal) 시 API 측에서 다른 모델로 자동 재시도(retry)를 수행한다. 클라이언트 측을 위해서는 TypeScript/Python/Go/Java/C# SDK 미들웨어가 제공된다. - 출력 생성 전에 거절된 요청은 과금되지 않으며, 재시도 시에는 "fallback credit"이 프롬프트 캐시(prompt cache)의 교체 비용을 환불해 준다.

발표 블로그에 따르면 분류기(classifier)의 작동은 "세션의 5% 미만"이며, 해당 트래픽은 Opus 4.8이 자동으로 처리한다. 외부 레드팀(red team)의 1,000시간 이상의 테스트에서 "유니버설 탈옥(universal jailbreak)은 발견되지 않았다"고도 밝혔다. 반면 Fable 5/Mythos 5는 "Covered Models"로 지정되어, 30일간의 데이터 보유가 필수이며 제로 데이터 보유(Zero Data Retention, ZDR)를 선택할 수 없다. ZDR을 전제로 컴플라이언스(compliance)를 구축하고 있는 조직에는 채택 여부를 결정짓는 차단 요소(blocker)가 될 수 있다.

기능 측면에서는 출시 시점에 effort, 메모리 도구(memory tool), 컨텍스트 편집(context editing, 베타), compaction, task budgets(베타), vision을 지원한다.

단기적으로 대응이 필요한 부분은, Fable 5를 통합할 경우 refusal 핸들링이 필수 코드 경로(code path)가 된다는 점이다. 지금까지 "모델의 거절"은 텍스트로 반환되는 모호한 현상이었으나, stop_reason을 통해 기계 판독 가능하게(machine-readable) 판정할 수 있는 이상, 이를 핸들링하지 않는 것은 설계 누락이 된다. 재시도(retry), 폴백(fallback), 과금 규격이 처음부터 세트로 문서화되어 있는 점은 운영 측면에서 다행스러운 부분이다.

비용 측면에서는, Opus 4.8의 2배 단가에 더해 새로운 토크나이저(tokenizer)로 인해 실효 토큰 수가 약 30% 증가하므로, 보기보다 청구 금액이 커지기 쉽다. 장시간의 에이전트 태스크나 1M 컨텍스트를 활용한 대규모 리포지토리(repository) 분석 등, Opus 4.8로는 감당하기 어려웠던 작업에 집중하는 것이 현실적일 것이다. 반대로 "medium effort에서도 FrontierCode 최고 점수"라는 주장이 사실이라면, 고(high) effort의 Opus 4.8과 저(low) effort의 Fable 5를 비교해 보는 것은 자신의 워크로드(workload)에서 측정해 볼 가치가 있다.

또한, 가공되지 않은 CoT(Chain of Thought)가 반환되지 않는 사양은, 사고 로그(thought log)를 감사나 디버깅에 사용하던 팀에 영향을 미친다. display: "summarized"의 요약본만으로 충분할지는 마이그레이션(migration) 전에 확인해 두어야 한다.

Claude API 키가 있다면 바로 테스트할 수 있다. 모델 ID는 claude-fable-5이다. Python에서 refusal를 포착하여 Opus 4.8로 폴백(fallback)하는 최소 형태는 다음과 같다.

import anthropic
client = anthropic.Anthropic()
def ask(prompt: str):
...

fallbacks 파라미터 및 fallback credit의 상세 내용은 앞서 언급한 API 변경 사항 문서에 정리되어 있다. 6월 22일까지는 유료 플랜에 포함되므로, Claude Code 등에서 /model로 Fable 5를 지정하여 동작을 살펴보는 것이 가장 간편하다.

게임 업계의 R&D 입장에서 눈길을 끈 것은, 발표 블로그에 슬쩍 언급된 『Slay the Spire』의 평가다. 영구 메모리(memory tool)를 부여했을 때의 성능 향상이 "Opus 4.8보다 3배 더 컸다"고 되어 있는데, 이는 플레이 경험을 통해 학습을 쌓아가는 게임 플레이 에이전트(gameplay agent)의 실용성이 한 단계 높아졌음을 시사한다. QA 자동화나 밸런스 조정을 위한 플레이 테스트 에이전트를 검증해 온 입장에서, 수일 단위의 자율 세션을 전제로 설계된 모델과 메모리 도구의 조합은, "플레이마다 문맥이 리셋된다"는 기존의 가장 큰 장벽을 정면으로 허물러 오고 있다는 느낌을 준다. 반면 30일 데이터 보유 강제는, 미발표 타이틀의 에셋을 다루는 개발 현장에서는 명확한 제약이다. 성능의 화려함보다는 "최상위 모델은 분류기와 폴백을 포함하여 출하한다"는 프레임워크가, 훗날 이 릴리스의 본질이었다고 평가받을 것 같다.

(본고의 사실관계는 2026년 6월 10일 시점의 공식 발표 및 공식 문서에 기반함. 벤치마크 수치는 자사 및 파트너사의 측정치이며, 제3자 검증은 아직 나오지 않음)

Anthropic이 'Claude Fable 5'를 GA 발표 — 1M 컨텍스트, $10/$50, 그리고 '거절(refusal)이 정상

요약

핵심 포인트

댓글