
돌아온 Fable 5! 하지만 요금은 Opus의 2배 ─ 지갑을 지키는 사용 가이드
요약
수출 규제로 중단되었던 Claude Fable 5가 재배포됨에 따라, 효율적인 사용을 위한 가이드를 제공합니다. 7월 7일까지 제공되는 한정된 무료 이용 기간을 활용하는 방법과 높은 비용을 방지하기 위한 모델 선정 전략을 다룹니다.
핵심 포인트
- Claude Fable 5의 재배포 배경 및 규제 해제 경위
- 7월 7일까지 Pro/Max 플랜 대상 주간 한도 50% 무료 제공
- 7월 8일 이후 적용되는 종량 과금 체계 및 비용 주의사항
- 태스크별 최적 모델(Fable 5 vs Opus vs Sonnet) 선정 가이드
이 기사의 대상 독자
- Claude Fable 5의 부활을 알고 "사용하고 싶지만 비쌀 것 같아"라며 망설이는 사람
- Pro / Max 플랜에서 7월 7일까지의 동봉 기간 동안 무엇을 시도해야 할지 알고 싶은 사람
- API 이용 시 "정신 차려보니 청구 금액이 두 배가 된" 상황을 반드시 피하고 싶은 사람
- Fable 5와 Opus 4.8 / Sonnet 4.6의 용도 구분 기준이 필요한 사람
이 기사를 통해 얻을 수 있는 것
- 중단부터 부활까지의 타임라인과 현재 사용 가능한 기능 정리
- Fable 5의 요금 구조와 청구 금액이 불어나는 메커니즘 이해
- 자주 저지르는 낭비 패턴 5가지와 그 회피책
- 태스크별 모델 선정 가이드와 비용 추산을 위한 Python 스크립트
이 기사에서 다루지 않는 것
- Fable 5의 내부 아키텍처(Architecture)에 대한 상세한 고찰
- Mythos 5의 심사제 프로그램 참여 방법
- 벤치마크의 망라적인 검증 (성능 이야기는 요점만 다룸)
2026년 7월 1일, Claude의 모델 목록에 Claude Fable 5가 돌아왔습니다. 6월 12일에 갑자기 사라진 이후, 약 3주 만의 부활입니다.
첫 소식을 접했을 때의 솔직한 감상은 (;゚д゚)멍하니 바라보는 것이었습니다. "미국 정부의 수출 규제로 인해 전 세계에서 사용할 수 없게 된 AI 모델"이라니, SF 소설의 설정인 줄 알았는데 현실이었던 것입니다.
먼저 시계열을 정리하겠습니다.
경위를 요약하자면, Amazon의 연구자가 Fable 5의 세이프가드(Safeguard)를 우회하여 소프트웨어 취약점을 특정하게 만드는 수법을 보고했고, 이를 근거로 미국 상무부가 6월 12일에 수출 규제 명령을 발령했습니다. API 측에 이용자의 국적을 판별하는 메커니즘이 없었기 때문에, Anthropic은 모든 고객에 대한 제공을 중단할 수밖에 없었다는 흐름입니다.
그 후의 검증을 통해, 보고된 취약점의 특정은 Opus 4.8이나 GPT-5.5 등 다른 많은 모델에서도 가능했다는 것이 확인되었고, Anthropic은 해당 수법을 99% 이상 차단하는 새로운 분류기(Classifier)를 추가했습니다. 정부와의 합의를 거쳐 7월 1일 재배포에 이르게 되었습니다.
1차 정보는 Anthropic 공식 발표 기사입니다.
이 중에서 개인 사용자에게 가장 중요한 문장은 이것입니다.
Fable 5 will be included for up to 50% of weekly usage limits through July 7
번역: 7월 7일까지, Fable 5는 주간 사용 한도의 50%를 상한으로 추가 요금 없이 이용할 수 있다 (대상은 Pro / Max / Team / 일부 Enterprise 플랜).
즉, 지금 이 순간은 최상위 모델을 월정액 플랜 범위 내에서 시험해 볼 수 있는 한정된 기간(Window)이 열려 있는 상태입니다. 그리고 7월 8일 이후부터는 이용 크레딧제, 즉 실질적으로 API 종량 과금과 동일한 취급을 받게 됩니다.
본 기사의 요금 및 제공 조건은 2026년 7월 2일 시점의 정보입니다. Anthropic은 "용량(Capacity)이 확보되는 대로 플랜 내 제공 확대를 목표로 한다"라고 밝히고 있어, 조건은 향후 변경될 가능성이 있습니다. 이용 전에 공식의 최신 정보를 확인해 주세요.
Fable 5가 어떤 모델인지, 중단 전 최초 출시 당시의 상세 내용은 아래 기사에 정리해 두었습니다. 본 기사는 "부활 후에 어떻게 대처할 것인가"에 집중합니다.
자, 부활을 기뻐했으니 본론으로 들어가겠습니다. 이 모델, 성능은 의심할 여지 없이 최강급이지만, 요금도 최강급입니다.
본 기사에서는 일관되게 이동 수단의 비유를 들어 설명하겠습니다. Claude의 모델 패밀리를 탈것으로 치환하면 다음과 같습니다.
| 모델 | 입력 / 1M 토큰 | 출력 / 1M 토큰 | 비유하자면 |
|---|---|---|---|
| Claude Fable 5 | $10 | $50 | 전세기 (Charter Helicopter) |
| ... |
Fable 5는 Opus 4.8의 정확히 2배의 운임입니다. 헬리콥터는 산속 깊은 현장에도 직선으로 날아갈 수 있지만, 근처 편의점에 가기 위해 사용하는 탈것은 아닙니다. 이 감각이 본 기사의 핵심입니다.
비용 계산식은 간단합니다.
Cost_{USD} = \frac{T_{in} \times 10 + T_{out} \times 50}{10^6}
여기서 까다로운 점은, 단가 2배만으로 끝나지 않는다는 점입니다. 헬기는 운임이 비쌀 뿐만 아니라, 연료 소비량 그 자체도 많습니다. Fable 5에는 청구 금액을 끌어올리는 구조적인 요인이 3가지 있습니다.
Opus 4.7 이후 계통에서는 새로운 토크나이저 (Tokenizer)가 채택되어 있어, 같은 텍스트라도 기존보다 최대 35% 정도 더 많은 토큰을 카운트할 수 있다고 공식적으로 주의를 주고 있습니다. 택시에서 헬기로 갈아탔더니 요금 미터기의 눈금 자체가 더 촘촘해졌다는 이야기입니다.
단가 2배 × 토큰 수의 증가로 인해, 체감되는 청구 금액은 2배를 넘어섭니다. "같은 작업인데 월간 비용이 급증했다"고 느껴진다면, 우선 이 부분을 의심해 보세요.
Fable 5는 사고 프로세스 (Thinking Process)가 상시 활성화되는 설계로, 기존과 같은 확장 사고 (Extended Thinking)의 온/오프 전환 기능이 없습니다. 헬기의 엔진은 비행하는 동안 계속 돌아갑니다. 깊은 사고에 의존하는 장면이 많을수록 출력 토큰 (Output Token)의 소비가 늘어나는 경향이 지적되고 있으며, 출력 단가 $50와 곱해지는 점이 뼈아픈 부분입니다.
사고의 깊이는 Effort 파라미터로 제어할 수 있습니다. 이는 헬기의 순항 고도와 같아서, 저고도에서 해결될 태스크에 고고도 비행을 시킬 의미는 없습니다. 태스크에 따라 조정하는 것이 비용 설계의 기본입니다.
Fable 5에는 사이버 보안, 생물, 화학, 모델 증류 (Model Distillation)와 같은 고위험 영역의 요청을 감지하면, 자동으로 Opus 4.8로 처리를 전환하는 안전 장치가 내장되어 있습니다. 헬기를 불렀는데 비행 금지 구역이라서 대신 택시가 오는 이미지입니다.
과금 측면에서는 양심적이라서, 출력 생성 전에 차단된 경우에는 Opus 요율로만 과금되며 헬기 요금은 발생하지 않습니다. 하지만 이를 뒤집어 생각하면, 보안 연구 등 해당 영역이 주 전장인 사람은 "2배를 내는 설정으로 택시에 계속 타고 있는" 셈이 될 수 있습니다. 해당 영역이 주 목적이라면, 처음부터 Opus 4.8을 지정하는 것이 합리적입니다.
요금 구조를 파악했으니, 다음으로는 실제로 저지르기 쉬운 "헬기 낭비" 패턴을 살펴보겠습니다.
필자의 주변이나 커뮤니티의 반응을 살펴보면, 청구 금액을 탕진하는 패턴은 대개 공통적입니다. 짐작 가는 부분이 있다면 지금 바로 운용 방식을 재검토하십시오.
"기왕 최강 모델이 왔으니 전부 이걸로 쓰면 되겠지"는 가장 비용이 많이 드는 판단입니다. Fable 5의 강점은 장시간·복잡·자율적인 태스크에서 극대화되도록 설계되었으며, 짧은 질의응답이나 작은 수정 작업에서는 하위 모델과의 체감 차이가 작다는 보고가 출시 전부터 다수 있었습니다.
제3자 집계 서비스인 llm-stats에 따르면, SWE-bench Verified에서 Fable 5는 95.0%, Opus 4.8은 88.6%를 기록했습니다. 차이는 분명히 존재하지만, 이 차이가 효과를 발휘하는 곳은 난제 영역입니다. 30분이면 끝날 소규모 태스크에 헬기를 계속 띄운다면, 월말 청구서를 보고 orz 하게 되는 것은 필연입니다.
Fable 5 계열의 모델은 사양·의도·제약 사항을 첫 번째 턴 (Turn)에 한꺼번에 전달할수록 효율이 올라간다고 공식 가이드에서 일관되게 권장하고 있습니다. 헬기에서 연료를 가장 많이 쓰는 때는 이착륙입니다. "아, 이것도 추가로", "역시 이렇게 수정해줘"라며 몇 번이고 이착륙을 반복하면, 그때마다 대화 이력이라는 짐을 전부 다시 싣고 재비행해야 하므로 입력 토큰 (Input Token)이 눈덩이처럼 불어납니다.
Fable 5의 컨텍스트 윈도우 (Context Window)는 100만 토큰입니다. 리포지토리 (Repository) 전체를 실을 수 있는 대형 헬기입니다. 하지만 입력 단가가 $10/1M이라는 것은, 100만 토큰을 한 번 싣는 것만으로 약 $10가 소요된다는 뜻입니다. 매 요청마다 풀 로딩(Full Loading)하는 운용은 자살 행위입니다. 후술할 프롬프트 캐시 (Prompt Cache)를 사용하거나, 필요한 파일만 실으십시오.
패턴 자체는 사소하지만, 보안 계열의 검증을 Fable 5로 하려다가 계속해서 Opus 4.8의 응답을 받고 있었다는 보고도 보입니다. 응답 모델은 확인할 수 있으므로, 폴백 (Fallback)이 빈번하게 발생하는 용도라면 처음부터 모델 지정 방식을 바꿔야 합니다.
이는 낭비라기보다 기회비용의 손실입니다. 지금은 주간 한도의 50%까지 헬기를 마음껏 탈 수 있는 프리패스 기간입니다. 7월 8일 이후에는 이용 크레딧제로 전환되므로, 전환 판단을 위한 검증은 이 기간 내에 마치는 것이 압도적으로 이득입니다 (검증 항목은 제6장에서 다룹니다).
구독 플랜에서도 7월 8일 이후에 크레딧을 설정해두지 않으면 Fable 5 자체를 선택할 수 없게 됩니다. 지속적으로 이용할 계획이 있는 분은 이용 크레딧 설정을 확인해 두시기 바랍니다.
해서는 안 될 일을 알았으니, 다음은 "그렇다면 언제 헬기를 타야 하는가"입니다.
결론부터 말하자면, 판단 기준은 태스크의 소요 시간과 자율성입니다. 다음의 흐름을 따르면 9할은 고민할 필요가 없습니다.
구체적인 태스크로 나누어 보면 다음과 같습니다.
| 태스크 | 권장 모델 | 이유 |
|---|---|---|
| 대규모 리팩터링 (Refactoring) | Fable 5 | 장시간의 자율 실행 (Autonomous execution) 시 성능 차이가 극대화됨. 헬기의 독무대 |
| ... |
판단이 어려울 때는 "이 태스크, 헬기가 아니면 현장에 도달할 수 없는가?"라고 자문해 보세요. 택시로 갈 수 있다면 택시입니다.
Claude Code에서는 설정에서 모델을 전환할 수 있습니다. 기본값을 하위 모델로 설정해 두고, 무거운 태스크일 때만 명시적으로 Fable 5로 전환하는 운영 방식이 실수로 인한 과금을 방지하는 가장 확실한 대책입니다.
모델을 구분해서 사용할 수 있게 되었다면, 다음은 헬기를 탈 때 자체의 비용을 낮추는 테크닉입니다.
어쩔 수 없이 Fable 5를 사용해야 하는 태스크라도, 운임을 낮추는 정공법이 3가지 있습니다.
동일한 컨텍스트 (시스템 프롬프트, 리포지토리의 주요 파일 등)를 반복해서 사용한다면, 프롬프트 캐싱 (Prompt Caching)이 최강입니다. 캐시 로딩은 **입력 단가의 10%**입니다. 매번 표를 사는 대신 정기권을 끊는 이미지로, 리포지토리를 하루 종일 다루는 용도라면 입력 비용을 대폭 절감할 수 있습니다.
쓰기 시에는 입력 단가의 1.25배(5분 캐시) ~ 2배(1시간 캐시)의 비용이 발생하므로, 2회 이상 재사용할 전망이 있는 컨텍스트에만 적용하는 것이 철칙입니다.
실시간성이 필요 없는 태스크 (대량의 분류, 요약, 테스트 생성 등)는 Batch API를 통해 50% 할인된 가격으로 이용할 수 있습니다. 급하지 않은 짐은 전용 헬기가 아니라 심야 합동편으로 보내세요. 단가가 높은 모델일수록 이 50%의 절대 금액은 커집니다.
앞서 언급했듯이, Fable 5의 사고 (Thinking)는 항상 켜져 있으며, 깊이는 Effort로 제어합니다. 정형화된 서브 태스크까지 최고 고도로 날아다닐 필요는 없습니다. 태스크의 난이도에 따라 Effort를 조정하는 것만으로도 출력 토큰의 소비, 즉 $50/1M 부분을 직접 깎을 수 있습니다.
"그래서 결국 우리 사용 패턴으로는 한 달에 얼마인가?"를 개산하는 Python 스크립트를 준비했습니다. 모델별 요율을 일원 관리하고, 계산 로직을 단일 함수로 집약한 DRY 구성입니다. 가지고 계신 예상치를 넣어서 돌려보세요.
클릭하여 소스 코드 전개
"""Claude 모델별 월간 비용 개산 시뮬레이터.
요율 정의 · 단발 계산 · 시나리오 집계를 분리한 단일 책임 구성.
요금은 2026년 7월 2일 기준 공표값 (USD / 1M 토큰).
...
직접 실행해 보면, 동일한 작업량이라도 시나리오 A와 B에 따라 월간 비용이 몇 분 의 일까지 차이 나는 것을 확인할 수 있습니다. 중요한 점은, Fable 5를 줄이는 것이 아니라, Fable 5가 빛을 발하는 4건의 리팩터링에는 제대로 헬기를 사용하고 있다는 점입니다. 낭비를 피하는 것과 인색하게 구는 것은 별개입니다.
테크닉이 준비되었으니, 마지막으로 "이번 주에 해야 할 일"로 정리하겠습니다.
프리패스 기간의 올바른 사용법은 '노는 것'이 아니라 '검증'입니다. 7월 8일 이후에 실제 비용을 내고 사용할지 판단하기 위해, 다음 3가지를 실행해 보시는 것을 추천합니다.
검증 1: 자신의 대표 태스크로 Opus 4.8과 비교하기
평소 업무에서 무거운 것, 보통인 것, 가벼운 것 3가지 태스크를 골라, Fable 5와 Opus 4.8 양쪽에 동일한 지시를 내려 출력을 비교합니다. 차이가 발생하는 태스크만이 7월 8일 이후에 헬기 값을 지불할 가치가 있는 태스크입니다.
검증 2: 장시간 자율 태스크의 완주율 확인하기
Fable 5의 진가는 수 시간 단위의 자율 실행에 있습니다. 평소라면 세세하게 나누어 지시했을 작업을, 사양을 정리한 단 한 번의 턴(Turn)으로 통째로 맡겨 보세요. 개입 없이 어디까지 정확하게 완주하는지가 단가 2배의 대가를 측정하는 가장 좋은 척도가 됩니다.
검증 3: 토큰 소비량 실측하기
동일한 태스크에서의 소비 토큰을 Opus 4.8과 비교하여 기록합니다. 새로운 토크나이저 (Tokenizer)와 상시 사고의 영향이 어느 정도인지는 용도에 따라 차이가 나기 때문에, 자신의 워크로드에서의 실측값이 7월 8일 이후의 예산 계획의 토대가 됩니다.
| 증상 | 원인 | 대처 |
|---|---|---|
| 청구 금액이 예상보다 2배를 초과함 | 새로운 토크나이저 + 상시 사고로 인해 토큰 소비 증가 | Effort 조정, 하위 모델로 분산, 실측을 통한 재견적 |
| ... | ||
| 용어 | 의미 | |
| --- | --- | |
| Mythos 클래스 | Opus 상위에 신설된 최상위 모델 계층. Fable 5는 그 첫 번째 일반 공개 버전 | |
| ... | ||
| 초급: 우선 타보기 |
7월 7일까지의 동봉 기간 중에 평소 태스크를 Fable 5에 던져 체감 차이를 확인한다. 본 기사의 검증 1만이라도 실행해 둔다.
중급: 운임(Fare)을 설계하기
API를 통한 이용으로 전환하고, 프롬프트 캐시 (Prompt Cache)와 Batch API를 도입한다. 태스크별 모델 배분 규칙을 스스로 명문화한다. 자신의 워크로드 (Workload) 실측값으로 비용 산출 스크립트를 업데이트한다.
상급: 배차를 자동화하기
태스크의 성격에 따라 모델을 자동 선택하는 라우팅 (Routing) 계층을 구현하고, 토큰 소비 로깅과 비용 모니터링 대시보드를 정비한다. 모델 ID는 설정에서 추상화하여, 향후 제공 조건이 변경되더라도 복구 비용(Rollback cost) 없이 대응할 수 있는 구성으로 만든다.
- Fable 5는 7월 1일에 글로벌 복귀.
- 7월 7일까지는 Pro / Max / Team / 일부 Enterprise에서 주간 상한선의 50%까지 추가 요금 없이 이용 가능 - 요금은 입력 $10 / 출력 $50로 Opus 4.8의 정확히 2배. 게다가 새로운 토크나이저 (Tokenizer)와 상시 사고 (Reasoning) 기능으로 인해 토큰 소비 자체도 늘어난다.
- 헬기는 산속 깊은 현장에 보내는 것이다.
- 수 시간 단위의 자율 태스크 (Autonomous task)에만 사용하고, 일상적인 업무는 Sonnet 4.6과 Opus 4.8로 돌린다 - 프롬프트 캐시 (Prompt Cache), Batch API, Effort 조절이라는 세 가지 포인트로 헬기 비용 자체를 낮출 수 있다.
- 고위험 영역이 주 목적이라면 폴백 (Fallback) 사양을 고려하여 처음부터 Opus 4.8을 선택한다.
솔직히 말해서, 한 번 사라졌다가 돌아온 장난감만큼 눈부셔 보이는 것은 없다. 복귀 첫날에 바로 꽤 무거운 리팩토링 (Refactoring) 하나를 맡겨버렸다. 결과에는 매우 만족하지만, 소비량을 보고 "이것은 지갑이 먼저 침묵할 유형이다"라고 확신하게 되었다. 헬기는 부르는 타이밍이 9할이다. 여러분도 즐거운 하늘 여행 되시길.
Anthropic 공식 재개발 발표 (2026-06-30):
Fable 5 / Mythos 5 발표 페이지:
관련된 본인의 다른 글:
Claude Fable 5 / ClaudeMythos / LLM / API / SWE-bench Verified
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기