본문으로 건너뛰기

© 2026 Molayo

Qiita헤드라인2026. 06. 15. 04:04

Claude Fable 5 API에서 '거부(Refusal)'가 에러가 아닌 정상 응답으로 처리되는 방식

요약

Anthropic이 Claude Fable 5와 Mythos 5를 출시하며 API 동작 방식에 중요한 변화를 가져왔습니다. 특히 모델 거부(Refusal)가 에러가 아닌 HTTP 200 정상 응답으로 처리되며, 이 경우 차순위 모델인 Claude Opus 4.8이 대신 답변합니다. 또한 과금 시스템은 이러한 폴백(fallback) 상황을 고려하여 설계되었습니다.

핵심 포인트

  • 모델 거부(Refusal)는 에러가 아닌 정상 HTTP 200 응답으로 처리됩니다.
  • Fable 5/Mythos 5 사용 시, 차단되면 Claude Opus 4.8이 폴백(fallback)되어 답변합니다.
  • 과금 시스템은 폴백 발생 시 비용을 정확히 안분하여 청구하는 배려가 있습니다.

stop_reason: "refusal"

에러가 아니라 HTTP 200의 정상 응답으로, 모델이 답변을 거절하는 방식입니다. Anthropic이 6월 9일에 출시한 Claude Fable 5의 API 문서를 읽다가 가장 먼저 눈에 들어온 부분이 바로 이 사양이었습니다.

이번 출시는 '하나의 모델을 두 가지 제품으로 내놓는다'는 독특한 구성입니다. 일반 사용자에게 제공되는 Claude Fable 5와 한정적으로 제공되는 Claude Mythos 5는 동일한 모델이며, 차이는 안전 분류기(safety classifier) 유무뿐입니다. Mythos 5는 미국 정부와 협력하는 Project Glasswing을 통해 사이버 방어 및 중요 인프라 사업자에게만 제공됩니다. 가격은 두 제품 모두 입력 $10/M, 출력 $50/M 토큰이며, 컨텍스트 창은 1M 토큰, 최대 출력 길이는 128k 토큰입니다. 공식 발표는 https://www.anthropic.com/news/claude-fable-5-mythos-5 에 있습니다.

성능에 대한 주장(거의 모든 벤치마크에서 SoTA, Stripe에서의 대규모 코드베이스 마이그레이션 사례 등)은 벤더 발표이므로 비판적으로 읽어야 하지만, 엔지니어로서 무시할 수 없는 부분은 API 통합 방식이 변경되는 지점입니다. 아래는 API 문서를 (https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5) 기반으로 정리한 내용입니다.

Fable 5의 분류기가 반응하는 경우는 사이버 공격, 생화학, 증류(모델 능력 추출)와 관련된 요청이며, Anthropic에 따르면 발동률은 세션 전체의 5% 미만입니다. 만약 발동할 경우, 요청은 에러가 나지 않고 차순위 모델인 Claude Opus 4.8이 대신 응답하도록 설계되어 있습니다.

과금 시스템 역시 이러한 동작 방식에 맞춰 구축되었습니다. 출력 전에 거부된 요청에는 과금이 발생하지 않습니다. AWS 블로그(https://aws.amazon.com/blogs/aws/anthropic-claude-fable-5-on-aws-mythos-class-capabilities-with-built-in-safeguards-now-available/)에 따르면, 스트리밍 도중에 차단될 경우, 그 시점까지가 Fable 요금이 적용되고 이후는 Opus 요금으로 안분됩니다. 폴백(fallback) 발생 시 응답은 Opus 가격으로 청구되므로, '비싼 모델을 사용했는데 저렴한 모델이 답변한 만큼의 비용까지 추가로 지불하는' 일은 없습니다. 사소하지만, 종량제 과금을 모니터링하는 입장에서 감사하게 생각되는 배려입니다.

문서 자체에서도

Messages API의 동작 방식에도 Fable/Mythos 고유의 변경 사항이 있습니다. thinking은 adaptive thinking만 가능하며, thinking: {"type": "disabled"}는 지정할 수 없습니다. 사고의 깊이는 effort 파라미터로 제어합니다. 또한, 원본 chain of thought(CoT)는 전혀 반환되지 않으며, thinking.display를 `

AI 자동 생성 콘텐츠

본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0