Anthropic이 'Claude Fable 5'를 GA 출시 — 1M 컨텍스트 · $10/$50, 그리고 '거부(refusal)'가 정상 응답이 되는 새로운 API 설계

2026년 6월 9일, Anthropic이 Claude Fable 5(claude-fable-5)와 Claude Mythos 5(claude-mythos-5)를 발표했다. 주목할 만한 점은 성능 수치만이 아니다. '최상위 모델을 안전 분류기(safety classifier)와 함께 일반 제공하고, 분류기에 걸린 요청은 별도의 모델로 폴백(fallback)시킨다'는, 기존 LLM API에는 없던 계약이 Messages API에 포함된 점이다. 본고의 사실 관계는 모두 아래의 1차 소스에서 가져왔다.

발표 블로그: https://www.anthropic.com/news/claude-fable-5-mythos-5
제품 페이지: https://www.anthropic.com/claude/fable
모델 사양: https://platform.claude.com/docs/en/about-claude/models/overview
API 변경점: https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5

무슨 일이 일어났나

Anthropic은 이번에 동일한 능력을 가진 두 개의 모델을 동시에 출시했다.

Claude Fable 5는 'Mythos급 모델을 일반 이용자에게 안전하게 만든 것(a Mythos-class model that we've made safe for general use)'이라고 설명되는, 회사의 최상위 일반 제공 모델이다. 6월 9일부터 Claude API, Claude Platform on AWS, Amazon Bedrock, Vertex AI, Microsoft Foundry에서 일반 제공(GA)이 시작되었다.

Claude Mythos 5는 같은 모델에서 일부 영역의 안전 분류기를 제외한 것으로, Project Glasswing 승인 고객에게만 한정 제공된다. 일반 개발자가 접하는 것은 Fable 5 쪽이다.

성능 면에서는 '테스트한 거의 모든 벤치마크에서 state-of-the-art'라고 주장하며, Cognition의 FrontierCode에서 'medium effort로도 프론티어 모델 중 최고 점수', Hebbia의 Finance Benchmark에서 전 모델 중 최고, 자체 코어 분석 벤치마크에서는 최초로 90% 초과를 기록했다. Stripe는 '통상적으로 팀이 2개월 이상 걸리는 코드베이스 전체 마이그레이션을 하루 만에 완료했다'고 언급했다(이는 고객의 증언이며, 재현 가능한 측정값은 아님에 유의).

6월 9일~22일까지는 Pro/Max/Team/Enterprise 플랜에서 추가 비용 없이 사용할 수 있으며, 6월 23일 이후부터는 이용 크레딧이 필요하게 된다.

기술적인 상세 내용

사양의 요점을 공식 문서를 통해 정리하면 다음과 같다:

컨텍스트 창(Context Window): 기본적으로 1M 토큰. 최대 출력은 128k 토큰 -
가격: 입력 $10/출력 $50 (per MTok). Opus 4.8($5/$25)의 정확히 2배. 프롬프트 캐시 사용 시 입력 90% 할인 -
토크나이저(Tokenizer): Opus 4.7에서 도입된 새로운 토크나이저를 사용한다. 이전 모델 대비 '같은 텍스트가 약 30% 더 많은 토큰 수로 계산된다'고 명시되어 있어, 비용 추산 시 주의해야 한다 -
사고 모드(Thinking Mode): Adaptive thinking이 상시 활성화되며, 이것이 유일한 사고 모드이다. `thinking: {
Messages API는 에러가 아니라
HTTP 200 정상 응답으로서 어떤 분류기(classifier)가 거부했는지도 응답에 포함되는 stop_reason: "refusal"을 반환한다.

fallbacks 파라미터(베타)를 전달하면, 거부 시 API 측에서 다른 모델로 자동 재시도(retry)를 수행한다. 클라이언트 측을 위해 TypeScript/Python/Go/Java/C# SDK 미들웨어가 제공된다. 출력 생성 전에 거부된 요청은 과금되지 않으며, 재시도 시에는 "fallback credit"이 프롬프트 캐시(prompt cache)의 교체 비용을 환불해 준다.

발표 블로그에 따르면 분류기 작동은 "세션의 5% 미만"이며, 해당 트래픽은 Opus 4.8이 자동으로 처리한다. 외부 레드팀(red team)의 1,000시간 이상의 테스트에서 "universal jailbreak는 발견되지 않았다"고도 밝혔다. 반면 Fable 5/Mythos 5는 "Covered Models"로 지정되어, 30일간의 데이터 보유가 필수이며 제로 데이터 보유(Zero Data Retention, ZDR)를 선택할 수 없다. ZDR을 전제로 컴플라이언스(compliance)를 구축하고 있는 조직에는 채택 여부를 결정짓는 차단 요소(blocker)가 될 수 있다.

기능 측면에서는 출시 시점에 effort, 메모리 도구(memory tool), 컨텍스트 편집(context editing, 베타), compaction, task budgets(베타), vision을 지원한다.

실무 엔지니어에게 미치는 영향

단기적으로 대응이 필요한 부분은 Fable 5를 도입할 경우 refusal 핸들링이 필수 코드 경로(code path)가 된다는 점이다. 지금까지 "모델의 거부"는 텍스트로 반환되는 모호한 현상이었으나, stop_reason을 통해 기계 판독 가능하게(machine-readable) 판정할 수 있는 이상, 이를 핸들링하지 않는 것은 설계 누락이 된다. 재시도, 폴백(fallback), 과금 사양이 처음부터 세트로 문서화되어 있는 점은 운영 측면에서 고무적이다.

비용 측면에서는 Opus 4.8의 2배 단가에 더해 새로운 토크나이저(tokenizer)로 인해 실효 토큰 수가 약 3할 증가하므로, 겉보기보다 청구 금액이 커지기 쉽다. 장시간의 에이전트 태스크나 1M 컨텍스트를 활용한 대규모 리포지토리(repository) 분석 등, Opus 4.8로 감당하기 어려웠던 작업에 집중하는 것이 현실적일 것이다. 반대로 "medium effort에서도 Frontier Code 최고 점수"라는 주장이 사실이라면, 고(high) effort의 Opus 4.8과 저(low) effort의 Fable 5를 비교해 보는 것은 자신의 워크로드(workload)에서 측정해 볼 가치가 있다.

또한, 가공되지 않은 CoT(Chain of Thought)가 반환되지 않는 사양은 사고 로그를 감사나 디버깅에 사용하던 팀에 영향을 미친다. display: "summarized"의 요약본만으로 충분할지는 이전에 확인해 두어야 한다.

테스트 방법

Claude API 키가 있다면 바로 테스트할 수 있다. 모델 ID는 claude-fable-5이다. Python으로 refusal를 포착하여 Opus 4.8로 폴백하는 최소 형태는 다음과 같다.

import anthropic
client = anthropic.Anthropic()
def ask(prompt: str):
...

fallbacks 파라미터 및 fallback credit에 대한 상세 내용은 앞서 언급한 API 변경 사항 문서에 정리되어 있다. 6월 22일까지는 유료 플랜에 포함되므로, Claude Code 등에서 /model로 Fable 5를 지정하여 동작을 살펴보는 것이 가장 간편하다.

소감

게임 업계 R&D라는 입장에서 눈길을 끈 것은 발표 블로그에 넌지시 적혀 있던 『Slay the Spire』의 평가다. 영구 메모리(memory tool)를 부여했을 때의 성능 향상이 "Opus 4.8보다 3배 더 컸다"고 되어 있는데, 이는 플레이 경험을 통해 학습을 쌓아가는 게임 플레이 에이전트의 실용성이 한 단계 높아졌음을 시사한다. QA 자동화나 밸런스 조정을 위한 플레이 테스트 에이전트를 검증해 온 입장에서, 수일 단위의 자율 세션을 전제로 설계된 모델과 메모리 도구의 조합은 "플레이할 때마다 문맥이 리셋된다"는 기존의 가장 큰 장벽을 정면으로 허물러 오고 있다는 느낌을 준다. 반면 30일 데이터 보유 강제는 미발표 타이틀의 소재를 다루는 개발 현장에서는 명확한 제약이다. 성능의 화려함보다 "최상위 모델은 분류기와 폴백을 포함하여 출하한다"라는 프레임워크가, 훗날 이 릴리스의 본질이었다고 평가받을 것 같다.

(본고의 사실관계는 2026년 6월 10일 시점의 공식 발표 및 공식 문서에 기반함. 벤치마크 수치는 자사 및 파트너 측정치이며, 제3자 검증은 아직 나오지 않음)

Insights

Anthropic, 'Claude Fable 5' GA 출시 - 거부(refusal)가 정상 응답이 되는 새로운 API 설계와 1M 컨텍스트

요약

핵심 포인트

Anthropic이 'Claude Fable 5'를 GA 출시 — 1M 컨텍스트 · $10/$50, 그리고 '거부(refusal)'가 정상 응답이 되는 새로운 API 설계

무슨 일이 일어났나

기술적인 상세 내용

실무 엔지니어에게 미치는 영향

테스트 방법

소감

Discussion

댓글

2026년 7월 통합 다이제스트 (Integration Digest for July 2026)

동일한 이미지 버그를 여섯 번이나 '수정'했습니다. 원인은 다크 모드가 아니었습니다.

나의 어시스턴트 만들기: AI 에이전트에게 내 파일 찾는 법 가르치기

VSCode에서 Claude Code와 DeepSeek 병용하기 — 터미널 탭을 전환하는 것만으로 끝나는 설정 가이드 (초보자용)

2026년 7월 통합 다이제스트 (Integration Digest for July 2026)

동일한 이미지 버그를 여섯 번이나 '수정'했습니다. 원인은 다크 모드가 아니었습니다.

나의 어시스턴트 만들기: AI 에이전트에게 내 파일 찾는 법 가르치기

VSCode에서 Claude Code와 DeepSeek 병용하기 — 터미널 탭을 전환하는 것만으로 끝나는 설정 가이드 (초보자용)