본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 10. 20:28

Claude Fable 5 및 Mythos 5: 6월 9일에 실제로 무엇이 바뀌었나

요약

Anthropic의 신규 모델 Claude Fable 5와 Mythos 5 출시 소식을 다룹니다. Fable 5는 코딩과 추론 벤치마크에서 최상위 성능을 보이며, Mythos 5는 사이버 보안 특화 폐쇄형 모델로 출시되었습니다.

핵심 포인트

  • Claude Fable 5는 코딩 및 추론 벤치마크 최상위 기록
  • Stripe의 대규모 Ruby 마이그레이션 기간을 획기적으로 단축
  • Mythos 5는 사이버 보안 방어를 위한 특화된 폐쇄형 모델
  • 에이전트적 작업 완료 능력의 비약적인 향상 확인
  • Opus 4.8 대비 높은 비용이나 높은 성능 제공

나는 6월 9일 밤을 나의 에이전트 스택 (agent stack)을 재구축하며 보냈고, 아침이 되었을 때 몇 주 동안 내 할 일 목록에 쌓여 있던 모든 일을 처리했습니다. 개인적인 경험과 더불어 기술적인 관점을 함께 전달하고자 합니다.

그날 밤 두 가지 모델이 출시되었습니다. Claude Fable 5는 공개 버전으로, Mythos급 모델이며 가격은 입력 100만 토큰당 $10, 출력 100만 토큰당 $50입니다. Mythos 5는 Project Glasswing 하에 사이버 보안 방어 파트너들을 위해 출시된 폐쇄형 버전으로, 특화된 위협 연구를 위해 운영 제약이 완화되었습니다.

Fable 5는 심도 있는 코딩 및 추론 (reasoning) 작업을 평가하는 데 사용하는 거의 모든 벤치마크 (benchmark)의 최상단에 위치합니다. Stripe는 5,000만 줄 규모의 Ruby 마이그레이션 (migration)을 이 모델로 실행하여 기간을 몇 달에서 며칠로 단축했습니다. 제약 분야에서는 팀들이 신약 개발 단계에서 최대 10배의 가속화를 보고했습니다. 과학자들은 블라인드 테스트를 통해 가설을 검증했으며, 80%의 확률로 모델의 출력을 선택했습니다.

안전성 측면에서는, 위험한 질의 (queries)가 발생할 경우 세션의 5% 미만에서 Opus 4.8로의 폴백 (fallback)이 트리거됩니다. Anthropic은 1,000시간 이상의 적대적 테스트 (adversarial testing)를 수행했으며, 출시 시점에 보편적인 탈옥 (jailbreak) 사례는 발견되지 않았습니다.

가격 맥락을 살펴보면: Fable 5는 Opus 4.8보다 두 배의 비용이 들지만, Mythos Preview 가격의 절반 미만입니다. Pro, Max, Team, 그리고 Enterprise 티어에서는 6월 22일까지 무료로 이용할 수 있습니다.

에이전트적 작업 완료 (agentic task completion) 능력의 비약적인 변화는 즉각적이었습니다. 이는 첫 한 시간 내에 체감할 수 있는 수준입니다. 우리는 소프트웨어가 구축되는 방식에 있어 진정으로 놀라운 순간을 살아가고 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0