
엔지니어 관점에서 분석한 Claude Fable 5 | Mythos 클래스 첫 일반 공개 모델과 안전 분류기(Safety
요약
Anthropic이 Opus 상위 모델인 Mythos 클래스의 첫 모델 'Claude Fable 5'를 공개했습니다. 장기적이고 복잡한 태스크에서 SOTA 성능을 보이며, 안전 분류기를 통해 고위험 쿼리를 Opus 4.8로 폴백하는 독특한 안전 메커니즘을 채택했습니다.
핵심 포인트
- Mythos 클래스의 첫 모델로 소프트웨어 엔지니어링 및 과학 연구 분야 SOTA 기록
- 장시간 복잡한 태스크 및 자기 수정(Self-correction) 루프에 최적화
- 안전 분류기가 고위험 쿼리 감지 시 Opus 4.8로 폴백하는 구조
- Stripe의 대규모 코드베이스 마이그레이션 사례를 통한 성능 입증
- 입력 $10 / 출력 $50 (1M tokens)의 요금 체계
2026년 6월 9일, Anthropic이 신규 모델 Claude Fable 5를 발표했습니다. Opus 상위에 위치하는 "Mythos 클래스"의 첫 번째 일반 공개 모델입니다. 본 기사에서는 엔지니어가 파악해야 할 핵심 포인트(능력, 요금, API, 안전 분류기(Safety Classifier)의 동작 및 함정)를 간결하게 정리합니다.
공식 블로그와 주요 미디어의 보도에 기반한 내용입니다. 과장을 배제하고 실무 운영에 유용한 정보에 집중합니다.
-
발표일:
2026/6/9 - 포지셔닝:
Mythos 클래스 (Haiku < Sonnet < Opus < Mythos)의 첫 일반 공개 모델 - API 모델명:
claude-fable-5 -
요금:
입력 $10 / 1M tokens, 출력 $50 / 1M tokens - 강점:
장시간·복잡한 태스크일수록 타 모델과의 격차가 확대됩니다. 소프트웨어 엔지니어링, 지식 노동, 비전(Vision), 과학 연구 분야에서 SOTA를 기록합니다. - 안전책: 사이버 / 생물·화학 / 증류(Distillation) 관련 쿼리는
분류기가 감지 → Opus 4.8로 폴백(Fallback) - 주의: 분류기가
**넓게 설정되어 있어, 양성(Benign) 쿼리의 오탐지(False Positive)**가 다수 발생 중
Mythos ─ Fable 5 / Mythos 5 ← New(프론티어. 장기·복잡한 작업에서 압도적)
Opus ─ Opus 4.8 (복잡한 추론·문제 해결)
Sonnet ─ Sonnet 4.6 (일상적 태스크의 주력)
...
Fable 5와 Mythos 5는 **동일한 기반 모델(Foundation Model)**이며, 차이점은 안전책의 유무뿐입니다. Mythos 5는 세이프가드(Safeguard)를 일부 해제한 버전으로, Project Glasswing 등의 신뢰할 수 있는 파트너에게만 한정 제공됩니다. 일반 사용자가 접할 수 있는 모델은 Fable 5입니다.
Claude Code와 같은 하네스(Harness) 위에서 수일 동안 계속 구동하며, 계획 → 진행 상황 확인 → 자기 수정(Self-correction) 루프를 돌릴 수 있습니다. 태스크가 길고 복잡할수록 우위를 점합니다.
공식에서 소개하는 대표 사례입니다. 조기 테스트에서 Stripe가 5,000만 행의 Ruby 코드베이스 전체 마이그레이션을 실시했습니다. 수작업이라면 팀 단위로 2개월 이상 걸릴 작업을 1일 만에 완료했다고 보고했습니다.
(※ "Stripe의 조기 테스트 보고"라는 전제하에 작성되었습니다. 모든 마이그레이션이 1일 만에 끝난다는 의미는 아닙니다)
-
스크린샷만으로
웹 앱의 소스 코드를 재구축 - 과학 도표로부터
수치 추출 - 구형 모델이 고전했던 Pokémon FireRed를
이미지만을 사용하는 하네스로 클리어 -
최고 노력(Highest Effort) 시에
자신의 출력을 검증 - 수백만 토큰에서도 집중력을 유지하며, **영속 메모리(자체 메모)**를 통해 개선
import anthropic
client = anthropic.Anthropic()
resp = client.messages.create(
...
- API 및 사용량 기반 Enterprise 버전에서는
첫날부터 풀 제공 -
Amazon Bedrock / AWS의 Claude Platform에서도 일반 제공
Fable 5는 본체와 별도로 **안전 분류기(Safety Classifier)**를 동반하며, 고위험 쿼리를 감지하면 **Opus 4.8로 폴백(Fallback)**시킵니다 (거부가 아니라 "하위 모델이 대신 답변"하는 방식).
[사용자 입력] → [분류기] ─ 고위험 ─→ [Opus 4.8이 응답 + 알림]
└ 일반(95%+) ─→ [Fable 5가 그대로 응답]
커버 영역:
- 공격적 사이버 보안 (exploit / malware / 공격 도구)
- 생물·화학 (실험 방법, 분자 메커니즘)
- 증류 (distillation: 경쟁 모델 학습을 위한 능력 추출)
- 일부 프론티어 LLM 개발 (분산 학습 기반, 특정 칩 전용 커널 등)
공식 수치: 발화(Trigger)는 평균 5% 미만의 세션, 95% 초과 시에는 폴백 없음. 외부 버그 바운티(Bug Bounty) 1,000시간 이상 진행되었으나 보편적인 탈옥(Jailbreak)은 발견되지 않았습니다 (단, 영국 AISI가 초기에 부분적인 진전을 보고함).
이 부분이 가장 주의해야 할 포인트입니다. 세이프가드는 안전 측면을 고려하여 의도적으로 넓게 설정되어 있어, 출시 직후부터 양성 쿼리에 대한 오차 차단(False Block)이 속출하고 있습니다.
- 면역학자가 "cancer"라고 입력했을 뿐인데 폴백(Fallback) 발생 - "Hello"가 차단되었다는 보고 - "Application Security Architect의 경력기술서 편집" 거부 - Claude Code 리포지토리에 다수의 버그 보고 접수
Anthropic 또한 "생물 관련 내용을 넓게 차단하도록 보수적으로 설정했다"고 인정했으며, Andrej Karpathy 또한 "다소 과민하다"라고 언급했습니다. 향후 오탐지(False Positive)를 축소하고, API에서는 차단 사유를 명시하며, 승인된 생물 연구자에게는 Mythos 5의 트러스티드 액세스(Trusted Access)를 안내할 방침입니다.
-
생물 / 화학 / 보안 관련 용어를 포함하는 프롬프트는 폴백(Fallback)을 전제로 설계할 것 - 폴백 발생 시 출력 모델은 Opus 4.8이 됨 (사용자에게 통지됨)
-
품질 요구사항이 엄격하다면, 폴백 감지 → 재시도(Retry) / 문구 재작성(Rewrite) 프로세스를 마련할 것 - 데이터 보관: Mythos 클래스는 30일간 보관 (학습에는 사용되지 않음)
-
6/9 ~ 6/22: Pro / Max / Team / Enterprise(좌석 기반 과금)에서 추가 비용 없이 이용 가능
-
6/23 이후: 플랜에서 일단 제외되며, 이용 시 **사용자 크레딧(User Credit)**이 필요함 - 이후 용량 확보 상황에 따라 표준 플랜으로 복귀 예정
제공 조건은 변경될 수 있습니다. 최신 정보는 공식 요금 및 도움말 페이지에서 확인하시기 바랍니다.
- Fable 5는 Opus 상위의 Mythos 클래스를 안전장치를 포함하여 일반 공개한 첫 번째 모델입니다.
- 장기(Long-context) · 대규모 · 복잡한 에이전트 작업에서 진가를 발휘합니다.
- 반면, **오탐지가 많은 분류기(Classifier)**가 현재의 마찰 요인입니다. 생물/보안 문맥은 설계를 통해 흡수해야 합니다.
길고 어려운 태스크는 Fable 5를, 생물·보안 문맥이 짙은 워크플로우는 폴백을 전제로 한 설계를 사용하는 것이 당면한 현실적인 해법이 될 것으로 보입니다.
Acrosstudio 주식회사 집행임원 CTO 주이(Shu Tsuyoshi)
애자일(Agile) 기반의 제품 개발 및 글로벌 개발 거점을 포함한 기술 조직의 구축·재생에 폭넓은 실적을 보유하고 있다. Nissan Shatai, Arvim Consulting, IBM Japan, RPA Holdings, Geniee 등 수많은 저명한 기업에서 매니지먼트 경험을 쌓은 후, 최근에는 스타트업 및 상장 기업의 CTO로서 글로벌 엔지니어 매니지먼트, AI 모델 구축, 제품 기획, AI 사업 개발을 수행했다. 생성형 AI 스타트업의 M&A, PMI 경험 및 사업 리드 경험도 보유하고 있다. 2024년 8월 Acrosstudio에 집행임원 CTO로 합류했다.
당사(Acrosstudio 주식회사) 소개
Acrosstudio는 업계 최초이자 유일한 존재인 "생성형 AI 구현형 컨설팅 펌"입니다.
기술력과 컨설팅 역량을 결합함으로써 클라이언트에게 본질적인 가치를 제공합니다. AI 프로젝트와 비(非) AI 프로젝트라는 두 바퀴가 회사의 미래를 구축한다고 믿으며, Acrosstudio만이 할 수 있는 포지셔닝을 지향하는 것이 가치 있다고 생각합니다.
현장에서 바로 사용할 수 있는, 생성형 AI 개발을 실현하는 FDE(Forward Deployed Engineer)형 지원 구조
Acrosstudio는 AI·IT 컨설팅의 전략 수립 능력 및 실행력과 생성형 AI 스타트업으로서의 기술력을 양립한 실행 지원형 파트너입니다. 단순한 AI 도구 제공이나 PoC·벤더로서의 개발에 그치지 않고, 구상 수립부터 업무 혁신, 개발·구현, 그리고 조직 안착까지 일관되게 지원하며 생성형 AI 기술을 현장의 오퍼레이션이나 조직·사업 전략에 통합하는 조직입니다.
당사는 AI 엔지니어, IT 엔지니어 (Backend, Frontend), AI Consultant, Project Manager, FDE(Forward Deployed Engineer), Infra/SRE/MLOps/AIOps/DevOps Engineer 등의 직군을 적극적으로 채용하고 있습니다.
관심이 있으시다면 아래 연락처로 언제든 편하게 연락해 주시기 바랍니다.
X: @ZY20240528
LinkedIn: tomcat-zhou
Facebook: zhou yi
Email: shu@acrosstudio.co.jp
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기