
드디어 Mythos가 온 건가...? 당신은 누구인가요, Claude Fable 5
요약
Anthropic이 차세대 모델인 Claude Fable 5와 Claude Mythos 5를 발표했습니다. 이번 업데이트의 핵심은 성능 향상뿐만 아니라, 위험한 주제에 대해 하위 모델로 응답을 전환하는 '폴백(Fallback)' 메커니즘을 통한 안전성 확보에 있습니다.
핵심 포인트
- Claude Fable 5와 Mythos 5는 동일 모델이나 세이프가드 유무의 차이가 있음
- 위험한 쿼리 감지 시 Opus 4.8로 응답을 전환하는 '폴백' 방식 도입
- Mythos 클래스라는 새로운 최상위 모델 라인업 공개
- 코딩, 비전, 메모리 등 전반적인 성능의 비약적 향상
새로운 Claude가 또 나와버렸습니다... 이번에는 "결국 무엇이 바뀌었나?"를 빠르게 캐치업(Catch-up)해 보겠습니다.
안녕하세요! 지난번에는 "갓 출시된 Claude Opus 4.8을 정리해 보았다"라는 글을 썼습니다. 감사하게도 지금까지 쓴 기사 중에서 가장 많은 반응을 얻었습니다. 읽어주신 분들 모두 감사합니다.
2026년 6월 10일(일본 시간), Anthropic이 Claude Fable 5와 Claude Mythos 5를 발표했습니다.
그런데 "Fable"이라고 하면, 제가 가장 먼저 떠올린 것은 만화 『더 파블(The Fable)』이었습니다(작은 목소리). 전설의 킬러 이야기 말이죠.
fable은 "우화·동화"라는 뜻입니다. 사실 mythos(신화)도 근원을 따져보면 마찬가지로 "이야기되는 것 = 이야기"를 가리키는 단어입니다. Anthropic에 따르면 그래서 대칭되는 이름으로 지었다고 합니다. 즉, Fable과 Mythos는 "형제" 같은 네이밍이 되어 있습니다. 그렇다면 왜 같은 날 출시된 두 모델에 굳이 형제 이름을 붙였을까요——이 점이 이번 내용과 직결됩니다.
지난번에는 Opus 4.8의 "정직함"을 주인공으로 내세웠지만, 이번에는 그 위를 넘어서는 차세대 모델입니다. 결론부터 말씀드리면, 이번에 가장 흥미로운 점은 성능 이야기가 아닙니다. "매우 똑똑한 모델을 안전하게 세상에 내놓기 위해 어떤 메커니즘을 발명했는가"가 내용의 핵심입니다.
그 메커니즘이 바로 **「폴백 (Fallback)」**입니다. 위험한 주제를 물으면 Fable 5가 아니라 한 단계 아래인 Opus 4.8이 대신 대답하는, 그리 흔치 않은 방식입니다. 이것이 이번 Anthropic의 발상입니다.
- Claude Fable 5 / Mythos 5에서 무엇이 바뀌었는가
- 주인공인 「폴백 (Fallback)」이란 결국 무엇인가? 왜 그런 구조로 만들었는가
- 능력의 핵심 (코딩·비전·메모리)
- 개발자가 알아두어야 할 사용상의 요점 (이 부분이 은근히 중요합니다)
Mythos 클래스라는 최상위 모델을 사상 처음으로 일반 공개했습니다. 단, 위험한 주제는 똑똑한 상태로 대답하게 두지 않고, Opus 4.8로 "폴백 (Fallback)" 시키는 새로운 방식을 채택했습니다.
| 대략적으로 | 내용 |
|---|---|
| 주인공 | Mythos급을 최초 일반 공개 (=Fable 5) |
| ... | - |
| 공개일: 2026년 6월 9일(미국) / 6월 10일(일본) - | |
| 위치: Opus 클래스의 그 위에 신설된 「Mythos 클래스」. 제1탄은 4월에 Glasswing 한정으로 출시된 Mythos Preview였으며, 이번이 일반 대상 제2탄. - | |
| Fable 5와 Mythos 5의 관계: 내용물은 동일한 모델. 차이점은 세이프가드(Safeguard)의 유무뿐. 안전책을 철저히 적용한 버전이 Fable, 이를 제거한 버전이 Mythos(이쪽은 한정 제공). - | |
| 이름의 유래: 서두에서 언급했듯이, Fable은 라틴어 fabula("이야기되는 것")에서 유래하여 mythos와 통하는 단어입니다. 내용물은 같은데 안전 장비가 다르기 때문에, 대칭되는 별명을 붙인 것입니다. |
Its capabilities exceed those of any model we've ever made generally available.
── Anthropic 공식 (@claudeai)
"지금까지 일반 제공한 그 어떤 모델보다 고성능"이라고 단언하고 있습니다. 아주 자신만만하네요.
평소 AI에게 위험한 질문(폭탄 제조 방법 등)을 하면 "답변할 수 없습니다"라며 거부합니다. Fable 5에는 이 거부와는 별개로 또 다른 움직임이 추가되었습니다.
사이버·생물화학·증류와 관련된 쿼리(Query)를 감지하면, Fable 5가 아니라 한 단계 아래인 Claude Opus 4.8이 대신 응답(폴백, Fallback)합니다. 화면에는 다음과 같이 표시됩니다.

**트리거(Trigger)는 "위험한가"가 아니라 "화제"**입니다. 보안 업무나 생물학 연구와 같은 정당한 질문이라도, 이 3가지 장르에 걸리면 Opus로 넘겨질 수 있습니다 (공식 측도 "무해한 요청이 걸릴 수 있음"을 인정하고 있습니다). -
폴백 (Fallback)은 거부의 대체가 아닙. 정말로 위험한 요구라면, 대타인 Opus 4.8이 기존 방식대로 거부합니다. "Fable이라면 무엇이든 대답해 준다"는 뜻은 아닙니다.
참고로, 이 세이프가드 (Safeguard)를 일부 해제한 버전이 Mythos 5입니다. 이 버전은 계속해서 사이버 방어 관계자 등 일부에게만 한정 제공되며, 일반 사용자는 접할 수 없습니다.
공식 문서와 공지(announcement)를 읽어보니, 탐지 대상은 3가지 카테고리였습니다.
Fable 5's safeguards detect requests related to cybersecurity, biology and chemistry, and distillation.
(Fable 5의 세이프가드는 사이버 보안, 생물학 및 화학, 그리고 증류(distillation)와 관련된 요청을 탐지합니다.)
── Anthropic 공식 (@claudeai)
| 카테고리 | 내용 |
|---|---|
| ① 사이버 보안 | 익스플로잇/멀웨어 제작, 정찰·횡적 이동(Lateral Movement) 등 에이전트적 해킹까지 폭넓게 |
| ... | 모델의 사고 추출. 문서상으로는 reasoning_extraction이라는 거부 카테고리 |
주목해야 할 점은 ③번입니다. 이것은 "Fable의 내부를 빼앗기지 않도록 하기 위한" 프레임워크로, 크게 두 가지 방향이 있습니다. 하나는 경쟁 모델을 육성하기 위한 대규모 능력 탈취(증류, Distillation), 다른 하나는 "내부의 추론을 전부 써내라"와 같은 지시에서 발동하는 reasoning_extraction입니다. 둘 다 목적은 동일하며, Fable의 똑똑함을 복제당하지 않도록 하는 것입니다.
그렇다면 "왜 그렇게까지 하는가"에 대한 답은 능력이 높기 때문입니다. 공식에 따르면, AAV(아데노 부속 바이러스)의 외각 조성(Shell Composition)을 예측하는 태스크에서, Mythos급 모델이 전용 단백질 특화 모델을 "생물학적 추론만으로" 능가했다고 합니다. 신약 개발 속도를 10배 높이는 힘은, 뒤집어 말하면 악용 리스크가 된다는 뜻입니다. 이른바 듀얼 유즈(Dual-use, 이중 용도) 문제죠. 그래서 "똑똑한 상태로 누구에게나 답하게 하는 것"이 아니라, 위험한 영역에서만 똑똑함을 제한한다는 판단을 내린 것입니다.
Stripe가 5,000만 행의 Ruby 코드베이스 전체 이전을 단 하루 만에 완료했다고 합니다. 사람이 팀 단위로 작업하면 2개월 이상 걸릴 규모입니다. SWE-Bench Pro는 80.3%를 기록했습니다.
↑ 에이전트적 코딩 (Agentic coding) (SWE-Bench Pro / FrontierCode).
※ 이것들은 코딩 계열이므로 폴백(Fallback) 대상에서 제외 = Fable 5의 순수 실력(후술할 * 이야기와는 별개).
이 부분이 개인적으로 가장 놀라운 지점입니다. 포켓몬(FireRed)을 화면 스크린샷만으로, 즉 비전(Vision)만으로 클리어했습니다. 이전 모델들은 보조 도구(Harness)를 주어도 클리어에 고전하던 영역입니다.
작년(2025년) AWS 서밋에 참가했을 때, Anthropic이 전시에서 비슷한 것을 보여주었던 것이 떠올랐습니다. (Anthropic의 메모와 엔지니어의 사인을 받았던 것이 그립네요)
수백만 토큰을 가로질러도 집중력이 흐트러지지 않습니다. 로그라이크 명작인 Slay the Spire에서 지속 메모리(Sustained Memory) 효과가 Opus 4.8의 3배였으며, 최종장에 도달하는 비율도 3배였다고 합니다.
그 외에도 공식에서 "장난기 가득한" 데모들이 나와 있으니 괜찮다면 확인해 보세요.
물리학의 제1원리로부터 태양계의 궤도를 도출하고, 일식까지 예측하는 시뮬레이션
공장 게임 Factorio를 스스로 전략을 세워 자동화
브라우저 CAD로 3D 프린팅 가능한 모델을 설계 (심지어 CAD 에디터 자체와 AI 코파일럿도 Fable 제품)
유체 시뮬레이션을 베토벤의 EDM 리믹스에 동기화 (그 곡 또한 코드로 생성, "음악을 들어본 적이 없음에도")
먼저 전환 방법부터 알려드립니다. Claude Code라면:
/model claude-fable-5
Opus 4.8에서 무엇이 바뀌었는지 표로 정리하면 다음과 같습니다.
| 항목 | Opus 4.8 | Fable 5 |
|---|---|---|
| effort 기본값 | high | high (low/med에서도 구형 xhigh를 넘는 경우가 많음) |
| thinking | adaptive (Off 가능) | 상시 On · 요약 출력만 제공 |
| 체감 응답 시간 | 보통 | 김 (수 분~, 자율 실행은 수 시간) |
| 위험 토픽 | 스스로 응답 | Opus 4.8로 폴백 (Fallback) |
| 가격 (입/출 per 1M) | $5 / $25 | $10 / $50 |
대략적인 요점:
사고(Thinking)가 항상 켜져 있으며, 응답이 길어질 수 있습니다. 한 번의 요청에 몇 분에서, 자율 실행(Autonomous execution)의 경우 몇 시간까지 늘어날 수도 있습니다. 클라이언트 측의 타임아웃, 스트리밍, 진행 상황 표시 기능은 재검토하는 것이 좋습니다 (공식 측에서도 "이전 모델에서 가장 큰 변화점"이라고 언급했습니다).
Thinking is always on, and responses can take longer.
── Anthropic 공식 (@ClaudeDevs)
**effort는 high가 기본값(Default)**으로 설정되어 있어도 괜찮습니다. Fable의 low/medium 설정이 이전 모델의 xhigh를 종종 능가하기 때문에, xhigh는 정말 어려운 문제에만 아껴두세요.
In our evals, even low/medium often beat previous models at xhigh
── [Anthropic 공식 (@ClaudeDevs)]
(https://x.com/ClaudeDevs/status/2064394925358366821)
↑ FrontierCode (최난도 Diamond 서브셋). 정확도 vs 비용. Fable은 어떤 effort 설정에서도 Opus 4.8보다 우위에 있습니다.
프롬프트는 오히려 심플한 것이 좋다고 합니다. 이전 모델용으로 정교하게 만들어진 프롬프트나 skill은 Fable에게 과도한 지정(Over-specification)이 되어, 오히려 성능이 떨어질 수도 있다고 합니다. 일단은 아무런 가공 없이 그대로 시도해 보는 것을 추천합니다.
Existing prompts or skills developed for prior models are often too prescriptive for Fable.
── Anthropic 공식 (@ClaudeDevs)
"자신의 추론을 본문에 전부 써달라"는 식의 지시는 금물입니다. 앞서 언급한 reasoning_extraction이 발생하여 폴백(Fallback)이 늘어납니다. 추론 과정을 보고 싶다면 adaptive thinking의 구조화된 thinking 블록을 사용하세요.
내부 추론을 응답 텍스트로 출력하도록 지시하면 reasoning_extraction을 유발하여 Opus 4.8로의 폴백을 증가시킨다 (요지)
── 공식 docs: 프롬프팅 가이드
장시간 태스크는 "진행 상황을 도구(Tool)의 결과에 비추어 보고해줘"라고 지시하면, 허위 상태(Hallucinated status) 보고가 거의 사라진다고 합니다. ...이것은 지난번 Opus 4.8에서 강조했던 "정직함(Honesty)" 노선이 제대로 이어지고 있다는 뜻입니다. 시리즈 전체를 관통하는 일관된 흐름이 느껴집니다.
진행 상황 보고를 도구 실행 결과에 비추어 수행하게 하면, 허위로 만들어진 진행 상태가 거의 해소되었다 (요지)
── 공식 docs: 프롬프팅 가이드
공식 벤치마크 표는 이것입니다. 단, 읽을 때 주의할 점이 있으니 미리 말씀드립니다.
첫째: 수치는 "Mythos 5와 Fable 5 중 더 높은 쪽"을 기재하고 있습니다.
둘째: * 표시가 붙은 항목(Cyber, Terminal-Bench, Health 등)은 어디까지나 Mythos 5의 수치입니다. 일반 사용자가 사용하는 Fable 5의 경우, 이 부분에서는 폴백이 작동하여 Opus 4.8 수준으로 성능이 떨어집니다. 예를 들어 Cyber 항목이 78.0%라고 되어 있더라도, Fable은 그 지점에서 40%(Opus 4.8 수준)로 폴백합니다.
반대로 * 표시가 없는 항목(SWE-Bench Pro, Computer use, 공간 추론 등)은 순수하게 Fable 5의 실력으로 이해하셔도 무방합니다.
테스터들의 목소리도 나오고 있는데, Cursor는 "장기 태스크를 다룰 수 있는 폭이 단번에 넓어졌다", Replit은 "1년 전이라면 프롬프트가 백 번은 필요했을 앱을 단 한 번에 만들 수 있었다"라는 평가를 남겼습니다. 총 14개 기업이 조기 테스트에 참여했습니다.
한정판인 Mythos 5는 Cyber 안전 장치를 해제한 버전으로, 우선은 Glasswing의 사이버 방어 파트너들을 대상으로 합니다.
For a small group of cyber defenders and critical infrastructure providers, we are also launching Claude Mythos 5.
── Anthropic 공식 (@claudeai)
향후에는 미국 정부와도 협의하며, 신뢰 접근 프로그램(Trusted Access Program)을 통해 단계적으로 대상을 확대할 예정이라고 합니다. 나아가 생물 의학 연구자들을 위해서도 생물·화학 안전 장치만 해제한 버전(Cyber는 유지)을 개방해 나갈 예정이라고 합니다.
또 하나 중요한 점은, Mythos 클래스는 모든 트래픽에 대해 30일간의 데이터 보관이 의무화되었다는 것입니다. 학습에는 사용하지 않고 안전 목적으로만 제한하며, 원칙적으로 30일 후에 삭제됩니다. 프라이버시 측면에서는 이 부분을 주의해야 하며, 실무 등에서는 당분간 사용하기 어렵겠네요.
Fable 5 = Mythos 클래스를 사상 처음으로 일반 공개한 모델. 내부 구성은 Mythos 5와 동일하며, 차이점은 안전 장치의 유무뿐입니다. - 주인공은 성능이 아니라
**「폴백 (Fallback)」**이라는 새로운 방식입니다. 사이버/생물·화학/증류(=사고의 추출)의 3가지 카테고리가 감지되면, Opus 4.8이 대신 투입됩니다. - 능력은 진짜입니다. Stripe의 하루 이행, 포켓몬을 시각 정보만으로 클리어, Slay the Spire에서 메모리 3배 사용 등.
- 벤치마크 표의
*
에는 주의가 필요합니다. Fable에서 솔직하게 나오지 않는 수치들이 있습니다. - 가격은 $10/$50입니다. 구독 서비스는 6/22까지 무상 동봉되며, 6/23 이후부터는 크레딧제로 전환됩니다.
능력 경쟁에 관한 뉴스는 질릴 정도로 쏟아져 나오고 있지만, "너무 똑똑한 모델을 어떻게 안전하게 전달할 것인가 >>> 거절이 아닌 대타 투입"이라는 발상이 앞으로 널리 퍼질 것 같네요. 지난번의 「정직함 (Honesty)」과 더불어, Anthropic이 무엇을 중요하게 여기고 있는지 점점 보이기 시작한 것 같습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기