Claude Fable 5: 8개의 출시 보고서가 빌더들에게 전하는 메시지 (2026년 6월)

NextFuture에서 최초 게시됨

Anthropic은 2026년 6월 9일, Mythos 클래스의 모델 중 일반 대중에게 처음으로 공개되는 Claude Fable 5를 출시했습니다. 6월 8일부터 6월 10일 사이에 발표된 8개의 출시 보고서(The Verge, Wired, TechCrunch, 3개의 Dev.to 심층 분석, 2개의 가격 추적기)를 종합해 보면, 키노트에서 제시된 것보다 더 좁은 범위와 더 높은 가격이라는 그림이 나타납니다. 내일 모든 빌더(builder)들이 인용하게 될 단 하나의 헤드라인 수치는 다음과 같습니다: 100만 토큰당 입력(input) $10, 출력(output) $50로, 이는 Claude Opus 4.8 티어의 정확히 2배입니다.

요약 (TL;DR): 수치 정보

지표	Claude Fable 5	참조 (Opus 4.8)	출처
입력 가격 (Input price)	$10.00 / 1M tokens	$5.00 / 1M tokens	2개 보고서
출력 가격 (Output price)	$50.00 / 1M tokens	$25.00 / 1M tokens	2개 보고서
컨텍스트 윈도우 (Context window)	1,000,000 tokens	200,000 tokens	3개 보고서
최대 출력 (Max output)	128,000 tokens	32,000 tokens	2개 보고서
안전 등급 (Safety class)	Mythos (공공 안전)	Standard	5개 보고서
차단된 도메인 (Blocked domains)	사이버 보안, 생물학	이 수준에서는 없음	3개 보고서
Microsoft 내부 액세스	제한됨 (데이터 보관)	사용 가능	1개 보고서

각 행은 2026년 6월 8일~10일 사이의 여러 독립적인 보고서를 집계한 것입니다. 출처 목록은 끝에 기재되어 있습니다.

이 비교 데이터가 구성된 방식

Fable 5가 어제 출시되었기 때문에, 이번 주에 여러분이 보게 될 모든 "리뷰"는 사실 출시 보고서의 합성(synthesis)입니다. 본 자료는 2026년 6월 8일에서 6월 10일 사이에 nextfuture 뉴스 파이프라인을 통해 드러난 8개의 보고서를 측정 신호(가격, 컨텍스트, 안전성, 가용성)를 기준으로 집계한 것입니다.

포함 (Inclusion): 2026년 6월 8일~10일 사이에 게시되었으며, 최소 하나 이상의 정량화 가능한 주장(가격, 컨텍스트 (Context), 가용성 (Availability), 제한 사항 (Restriction), 분류 (Classification))을 포함함.
제외 (Exclusion): Anthropic의 자체 발표 페이지 (출시 날짜를 확인하기 위한 기준값(Ground Truth)으로만 사용), Fable 관련 수치가 없는 일반적인 AI 뉴스 모음, 동일한 TechCrunch 기사의 배포본.
정규화 (Normalization): 가격은 100만 토큰당 USD 기준. 보고서에서 절대적인 수치 없이 "Opus 4.8 가격의 2배"라고 인용한 경우, Opus 4.8의 참조값은 2026년 6월 1일 기준 공개된 $5 입력 / $25 출력 티어(Tier)를 따름.

아직 아무도 Fable 5에 대해 비공개 SWE-bench 또는 LiveCodeBench 점수를 실행하지 않았습니다. 이 글을 쓰는 시점 기준으로 공개 벤치마크 그리드(Benchmark grid)는 비어 있습니다. 현재 우리가 확보한 정보는 가격, 패키징, 안전성 태세(Safety posture), 그리고 배포 마찰(Deployment friction)에 관한 한 대형 기업 고객(Microsoft)의 초기 신호입니다.

가격: $10/$50 티어가 핵심이다

세 개의 보고서가 동일한 수치로 수렴합니다: 입력 토큰 100만 개당 $10, 출력 토큰 100만 개당 $50입니다. 이는 Opus 4.8 티어($5/$25)의 정확히 2배이며, Dev.to 가격 분석에 기록된 GPT-4o의 $2.50 입력 가격보다 약 4배 높습니다. 동일한 가격이 승인된 "Project Glasswing" 파트너에게만 제한적으로 제공되는 Claude Mythos 5에도 적용됩니다.

전형적인 Cursor 스타일의 코딩 세션 — 50K 입력 컨텍스트 토큰, 턴당 8K 출력 토큰, 총 40턴 — 의 경우, Fable 5는 세션당 약 $36를 청구합니다. 이는 Opus 4.8의 $18, GPT-4o의 약 $3.45와 대조적입니다. 가격 장벽은 실재하며, 이는 Anthropic이 지금까지 공개적으로 제공한 가장 높은 티어에 위치합니다. 이 프리미엄이 가치가 있는지에 대한 비교 프레임워크는 이전 분석인 Claude Opus가 DeepSeek보다 7배 더 가치 있는가?를 참조하십시오. Fable 5는 해당 비교 결과에 또 다른 2배의 배수를 더한 셈입니다.

컨텍스트 및 출력: 입력 1M, 출력 128K

가격 보고서와 Dev.to의 capabilities deep-dive 모두 1,000,000-토큰 컨텍스트 윈도우 (context window)와 128,000-토큰 최대 출력 (max output)을 언급하고 있습니다. 이는 Opus 4.8 컨텍스트 (200K)의 5배이며, 최대 출력 (32K)의 4배에 달하는 수치입니다.

128K의 출력 한계치는 과소평가된 수치입니다. 지난 1년 동안 출시된 대부분의 "롱 컨텍스트 (long context)" 모델들은 입력 측면은 확장했지만 출력은 8K 또는 16K로 제한했습니다. 이는 계획이나 리팩토링 (refactor) 내용이 코드 한 화면을 넘어가는 순간, 장기적 관점의 에이전트 루프 (long-horizon agent loops)를 깨뜨려 버렸습니다. 128K의 출력 예산은 단 한 번의 Fable 5 호출만으로도 청킹 (chunking) 없이 전체 멀티 파일 리팩토링, 30페이지 분량의 기술 문서, 또는 완전한 에이전트 트랜스크립트 (agent transcript)를 반환할 수 있음을 의미합니다. 에이전트 스택 (agent-stack) 설계자들에게 이것은 마케팅용 문구가 아니라 구조적인 변화입니다.

주의할 점: 8개의 보고서 중 어느 것도 '건초더미 속 바늘 찾기 (needle-in-a-haystack)' 테스트를 통해 1M 컨텍스트 수치를 독립적으로 검증하지 않았습니다. Anthropic의 주장이 유일한 근거입니다. 제3자 테스트 프레임워크 (third-party harnesses)가 재현율 곡선 (recall curves)을 발표하기 전까지는 이 수치를 명목상의 수치로 취급하십시오. 해당 결과는 2주 이내에 발표될 것으로 예상됩니다.

헤드라인 수치가 거짓일 때

The Verge와 TechCrunch 전반에 걸친 키노트 언어는 동일합니다: "소프트웨어 엔지니어링 (software engineering), 지식 노동 (knowledge work), 그리고 비전 (vision) 분야에서 탁월한 성능을 보이며, 작업이 길어지고 복잡해질수록 다른 모델들과의 격차가 벌어집니다." 이 문구는 Anthropic의 것이며 토씨 하나 틀리지 않고 반복되고 있습니다. 어떤 소스도 구체적인 SWE-bench 또는 Terminal-bench 수치를 인용하지 않았습니다. 2026년 6월 모델 출시 웨이브 정리에 따르면 같은 주에 출시되어 50ms 미만의 TTFT (Time To First Token)를 주장한 GPT-5 Turbo와의 공개적인 헤드 투 헤드 (head-to-head) 비교도 없으며, Claude 4.5 Opus와의 공개적인 헤드 투 헤드 비교도 없습니다.

"Mythos-class를 안전하게 만들었다"라는 프레임워크는 측정 격차 (measurement gap) 또한 숨기고 있습니다. Wired와 TechCrunch의 두 번째 보고서 모두 Fable 5가 "사이버 보안 및 생물학(biology)과 같은 고위험 영역"을 차단하는 가드레일 (guardrails)과 함께 출시되었다고 언급했습니다. 하지만 두 매체 모두 거부율 (refusal rate), 무해한 보안 작업에 대한 오탐률 (false-positive rate), 또는 정당한 레드팀 (red-team) 및 생물학 연구 워크플로우에서 Fable 5가 Opus 4.8과 어떻게 비교되는지에 대한 수치를 제시하지 않았습니다. 침투 테스트 (pentesting), 취약점 연구 (vulnerability research), 또는 생명공학 (biotech) 분야에서 활동하는 빌더들은 측정이 이루어지기 전까지 성능 저하 (capability loss)가 있다고 가정해야 합니다. 이전 Mythos 등급 모델들이 공격적 보안 (offensive-security) 작업에서 어떻게 작동하는지에 대한 맥락은 당사의 Mythos vs GPT-5.5-Cyber 벤치마크를 참조하십시오.

Microsoft의 신호가 실제 위험 지표입니다

출시 24시간 이내에, The Verge는 Anthropic의 새로운 데이터 보유 (data retention) 요구 사항으로 인해 Microsoft가 내부적인 Fable 5 사용을 제한하고 있다고 보도했습니다. Microsoft는 GitHub Copilot 및 Azure Foundry 고객들에게 Fable 5를 제공했으나, 자사 직원들이 사용하는 모델 선택기 (model picker)에서는 이를 제외했습니다.

이는 하나의 데이터 포인트일 뿐 추세는 아닙니다. 하지만 선행 지표 (leading indicator)이기는 합니다. Microsoft 규모의 프런티어 AI (frontier AI) 고객이 새로운 보유 약관을 거부하고 있다면, 향후 30일 동안 Fable 5를 접하는 모든 규제 대상 기업에서도 유사한 검토가 이루어질 것으로 예상해야 합니다. 기업 고객의 데이터를 대상으로 실행되는 제품에 Fable 5를 통합하는 빌더들은 누구에게 가격을 제시하기 전에 새로운 데이터 처리 합의서 (DPA)를 읽어야 합니다. 가격 책정-시범 운영-구매로 이어지는 과정 사이의 간극이 바로 거래가 정체되는 지점입니다.

빌더 프로필별 판결

사이드 프로젝트를 출시하는 1인 개발자 (Solo dev shipping side projects): 당분간 Fable 5는 건너뛰세요. 1M 출력 토큰당 50달러의 비용을 고려하면, 에이전트 루프(agent loops)를 한 번 돌리는 데 주말 하루만 써도 100달러가 넘게 나갈 수 있습니다. 1M 출력 토큰당 25달러인 Opus 4.8이나, 3달러인 Sonnet 4를 사용하면 동일한 사이드 프로젝트를 10분의 1 비용으로 출시할 수 있습니다.
예산 압박이 있는 5~20명 규모의 팀: 2주 정도 기다리세요. 첫 번째 제3자 SWE-bench 및 LiveCodeBench 수치가 발표될 것입니다. 만약 Fable 5가 SWE-bench-Verified에서 80% pass@1을 통과하지 못한다면, 일반적인 코딩 작업에 대해 Opus 4.8보다 2배 높은 프리미엄을 지불하는 것은 정당화될 수 없습니다.
비용에 민감한 배치 워크로드 (Cost-sensitive batch workload): 전환하지 마세요. Fable 5의 입력 가격($10/1M)은 GPT-4o의 4배이며, DeepSeek V4 Flash의 67배입니다. 배치 요약(Batch summarization), 분류(classification), RAG 검색(RAG retrieval)에는 Mythos급 추론 능력이 필요하지 않습니다. 저가형 티어의 현황은 당사의 [$3.00 vs $0.50 per million tokens decision]을 참조하세요.
지연 시간(Latency)에 민감한 사용자 대상 앱: 아직 공개된 TTFT(Time To First Token) 수치가 없습니다. GPT-5 Turbo가 주장하는 50ms 미만의 상한선이 기준점입니다. Fable 5가 그에 필적하는 스트리밍 벤치마크를 내놓기 전까지는 지연 시간에 민감한 호출을 다른 곳으로 라우팅하세요.
장기 계획 에이전트 빌더 (Long-horizon agent builder): Fable 5가 제값을 할 수 있는 유일한 그룹입니다. 128K 출력 상한선과 1M 컨텍스트(context)는 이전에 청킹(chunking)해야 했던 다단계 계획(multi-step plans)의 병목을 해소합니다. 엄격한 예산 한도를 설정하고 하나의 에이전트 루프에서 시범 운영하며, 토큰당 비용이 아닌 '완료된 작업당 비용(cost-per-completed-task)'을 측정하세요.
규제 데이터를 다루는 엔터프라이즈 개발자: 시범 운영 전에 Anthropic의 새로운 데이터 보유 DPA(Data Processing Agreement)를 읽어보세요. Microsoft는 이미 이 이유로 내부 Copilot에서 이를 제외한 바 있습니다.

검토된 출처 (Sources reviewed)

Anthropic이 첫 Mythos급 모델 Claude Fable을 출시하다 — The Verge, 2026년 6월 9일 기고: 안전 분류(safety classification), 기능 범위 설정(capability framing).
Anthropic의 Claude Fable 5는 오늘날 대중이 접근할 수 있는 Mythos 버전이다 — TechCrunch, 2026년 6월 9일 기고: 차단된 도메인 목록(blocked-domain list), Mythos 관련성.
Anthropic이 가장 강력한 모델 Claude Fable 5를 공개적으로 출시하다 — TechCrunch, 2026년 6월 9일 기고: 사이버 보안 기능 범위 설정(cybersecurity-capability framing), 출시 배경.
Anthropic이 사이버 파트너를 위해 Mythos 업그레이드를 제공하고 나머지 사용자에게는 '안전한' 버전을 제공하다 — Wired, 2026년 6월 9일 기고: GA 채널(GA channels), Mythos 대 Fable 구분.
Claude Fable 5와 Mythos 5 가격 책정: Anthropic의 새로운 $10/$50 최상위 티어 — Dev.to (Alex Mercer), 2026년 6월 9일 기고: 입력/출력 가격(input/output prices), 2배 Opus 비율, 1M 컨텍스트, 128K 출력.
Claude Fable 5: 그것이 무엇인지, 벤치마크, 안전성 및 API 액세스 — Dev.to (CometAPI), 2026년 6월 10일 기고: 기능 요약(capability summary), API 액세스 범위 설정.
Microsoft가 데이터 보존 우려로 직원들에게 Claude Fable을 제한하다 — The Verge, 2026년 6월 10일 기고: 기업 내부 제한 신호(enterprise-restriction signal), DPA 마찰 선행 지표(DPA-friction lead indicator).
The AI Model Release Wave: June 2026 Is Absolutely Stacked — Dev.to (Doremon AI), 2026년 6월 10일, 기여: 비교 기준점(comparison baseline)을 위한 GPT-5 Turbo 및 Claude 4.5 Opus 컨텍스트.

FAQ

저자가 이 벤치마크(benchmarks)를 직접 수행했나요?

아니요. 이 포스트는 2026년 6월 8일부터 10일 사이에 발표된 8개의 보고서를 집계한 것입니다. 어떠한 비공개 벤치마크 수치도 주장하지 않습니다. TL;DR 표에 숫자가 나타나는 경우, 이는 소스 목록에 있는 최소 하나 이상의 보고서를 인용한 것이며, 두 개 이상의 독립적인 보고서가 동일한 수치로 수렴하는 경우 해당 행에 그 횟수를 기록했습니다.

독립적인 벤치마크를 수행하지 않고 왜 집계(aggregate)했나요?

Fable 5는 이 포스트가 올라오기 24시간 전에 GA(General Availability, 일반 가용성) 상태가 되었습니다. 공개적인 제3자 벤치마크 하네스(benchmark harnesses) (SWE-bench, LiveCodeBench, Terminal-bench)는 일반적으로 결과를 발표하는 데 5~10일이 소요됩니다. 현재 의사결정에 유용한 종합 정보는 가격 책정(pricing), 패키징(packaging), 안전 태세(safety posture), 그리고 초기 기업 배포(enterprise-deployment) 신호이며, 이는 정확히 8개의 발표된 보고서가 이미 다루고 있는 데이터입니다. 독립적인 벤치마크 실행은 SWE-bench-Verified 수치가 나오는 대로 별도의 포스트를 통해 이어질 예정입니다.

이 정보는 얼마나 최신인가요?

8개의 소스 모두 2026년 6월 8일에서 6월 10일 사이에 발표되었습니다. 가격은 2026년 6월 10일 기준입니다. Anthropic이 SWE-bench 스코어카드(scorecard)를 발표하거나 첫 번째 독립적인 지연 시간(latency) 테스트 결과가 나오는 즉시 수치는 구식이 될 것입니다. 이는 2주 이내에 발생할 것으로 예상됩니다. 2026년 7월 이후에 고객에게 이 수치를 인용하기 전에는 반드시 다시 확인하십시오.

Claude Fable 5: 8개의 출시 보고서가 빌더들에게 전하는 메시지 (2026년 6월)

요약

핵심 포인트

요약 (TL;DR): 수치 정보

이 비교 데이터가 구성된 방식

가격: $10/$50 티어가 핵심이다

컨텍스트 및 출력: 입력 1M, 출력 128K

헤드라인 수치가 거짓일 때

Microsoft의 신호가 실제 위험 지표입니다

빌더 프로필별 판결

검토된 출처 (Sources reviewed)

검토된 출처 (Sources reviewed)

FAQ

저자가 이 벤치마크(benchmarks)를 직접 수행했나요?

독립적인 벤치마크를 수행하지 않고 왜 집계(aggregate)했나요?

이 정보는 얼마나 최신인가요?

Mythos 5와 Fable 5의 차이점은 무엇인가요?

댓글