Claude Sonnet 5 출시: 변경 사항 및 현재 권장 사용법

Anthropic은 5주 만에 세 번의 모델 업데이트를 발표했습니다. 만약 변경 사항(changelog)을 면밀히 지켜보지 않았다면, 그 기간 동안 얼마나 많은 변화가 일어났는지 놓치기 쉽습니다. 저는 실제로 무엇이 변했는지, 각 모델의 용도는 무엇인지, 그리고 현재 제가 실제로 무엇을 사용하기를 권장하는지 정리해 보았습니다.

요약 버전

Claude Opus 4.8이 2026년 5월 28일에 출시되었습니다. 새로운 티어(tier)가 아닌, Opus의 신뢰성 업그레이드 버전입니다.
Claude Fable 5와 Claude Mythos 5가 2026년 6월 9일에 출시되었습니다. Mythos 클래스라고 불리는, Opus 상위의 새로운 티어에 속하는 첫 번째 모델들입니다.
Claude Sonnet 5가 2026년 6월 30일에 출시되었습니다. 가장 최신의 범용 모델(generally available model)이며, 현재 Free 및 Pro 플랜의 기본 모델입니다.

이 글에서 단 한 가지만 기억해야 한다면, 마지막 항목을 기억하세요. Sonnet 5는 대부분의 개발자가 일상적으로 사용하게 될 모델이며, 단순히 점진적인 개선이 아닌 Sonnet 4.6으로부터 의미 있는 도약을 이뤄낸 모델입니다.

Claude Sonnet 5: 우리 대부분에게 중요한 모델

Sonnet 5는 Opus보다 낮은 비용으로 에이전트적 코딩 (agentic coding), 도구 사용 (tool use), 추론 (reasoning), 그리고 일상적인 전문 업무를 위해 구축되었습니다. 전환하기 전에 알아두면 좋은 몇 가지 세부 사항은 다음과 같습니다:

1M 토큰 컨텍스트 윈도우 (context window). 토큰은 대략 단어의 4분의 3 정도이므로, 이는 Sonnet 5가 이전 부분의 흐름을 놓치기 시작하기 전까지 한 번에 약 700,000단어 이상의 대화나 코드를 기억할 수 있음을 의미합니다. 실제로 이는 단일 세션에서 전체 코드베이스나 긴 문서를 다루기에 충분한 양입니다.
128K 최대 출력 토큰 (max output tokens). 이는 한 번의 응답에서 생성할 수 있는 양의 상한선으로, 약 96,000단어에 달합니다. 이는 위에서 언급한 컨텍스트 윈도우(기억하는 양)와는 별개로, 모델이 생성하는 양(output)에 관한 것입니다.
적응형 사고 (Adaptive thinking)가 기본적으로 활성화되었으며, 수동 확장 사고 (manual extended thinking) 기능은 제거되었습니다. 이전 Claude 모델들은 어려운 문제를 위해

토크나이저 (tokenizer) 변경 사항은 잠시 시간을 들여 깊이 생각해 볼 가치가 있습니다. 앞서 언급한 두 가지 포인트가 서로 연결되어 있기 때문입니다. 동일한 프롬프트가 이제 더 많은 토큰을 소모하게 되었고, Anthropic도 이 사실을 알고 있기 때문에, 이를 대략적으로 상쇄할 수 있도록 현재 Sonnet 5의 가격을 더 낮게 책정했습니다. 여러분의 청구 금액은 현재와 비슷하게 유지되겠지만, 8월에 도입 가격(introductory pricing) 기간이 종료되면 비용이 일정하게 유지될 것이라고 가정하기보다는 다시 한번 계산해 볼 가치가 있습니다.

API용 모델 ID (Model ID):

claude-sonnet-5

Claude Code를 사용 중이라면, 버전 2.1.197부터 이미 기본 모델로 설정되어 있습니다.

Opus 4.8의 현재 위치

Opus 4.8은 Sonnet 5로 대체된 것이 아니라, 그와 나란히 존재합니다. 4.8 버전의 주요 변화는 단순한 벤치마크 성능 향상보다는 신뢰성 (reliability)에 있었습니다. Anthropic의 보고에 따르면, Opus 4.8은 자신이 생성한 코드의 결함을 경고 없이 통과시킬 확률이 Opus 4.7보다 약 4배 낮으며, 브라우저 에이전트 (browser agent) 작업을 위한 Online-Mind2Web에서 높은 점수를 기록했습니다.

Opus 4.8은 또한 노력 (effort) 파라미터를 도입하여, 작업에 실제로 필요한 추론 (reasoning) 양에 따라 표준 (standard), 추가 (extra), 최대 (max) 노력을 선택할 수 있게 했습니다. 이 파라미터는 Sonnet 5에도 그대로 이어졌습니다.

저의 실무적인 경험칙은 다음과 같습니다: 복잡한 아키텍처 결정, 긴 에이전트 세션 (agentic sessions), 그리고 고강도의 컴퓨터 사용 (computer use) 작업에는 Opus 4.8을 사용하세요. 기존에 Sonnet 4.6을 기본으로 사용하던 일상적인 코딩, 도구 사용 (tool use), 그리고 지식 작업에는 Sonnet 5를 사용하세요.

새로운 티어: Fable 5 및 Mythos 5

이 부분은 발표 내용 중 그 중요성에 비해 가장 적게 다뤄진 부분입니다. Anthropic은 Opus 상위 티어로 Mythos 클래스 (Mythos class)를 도입했으며, 그 첫 두 모델은 Claude Fable 5와 Claude Mythos 5입니다.

두 모델은 동일한 기반 역량을 공유합니다. 차이점은 안전 범위 (safety scope)입니다:

Claude Fable 5는 일반 사용이 가능한 (generally available) 버전입니다. 여기에는 사이버 보안 (cybersecurity) 및 생물학 (biology)과 관련된 플래그가 지정된 요청을 Claude Opus 4.8로 자동 라우팅하는 안전 분류기 (safety classifiers)가 포함되어 있습니다.
Claude Mythos 5는 이러한 분류기를 포함하지 않습니다. 이 모델은 Project Glasswing을 통해 승인된 조직으로 제한되며, 초대 전용 (invitation only) 방식으로 운영되어 직접 가입 (self serve signup)은 불가능합니다.

API를 통해 구축 중이며 Fable 5를 호출하고 있다면, Opus 또는 Sonnet 모델에서는 문제가 되지 않았던 몇 가지 동작을 고려해야 합니다: 분류기가 출력을 생성하기 전에 요청을 거절할 수 있으므로 거절 (refusals)에 대한 새로운 응답 처리 방식, 그러한 상황이 발생했을 때 다른 모델로 재시도하기 위한 폴백 경로 (fallback path), 그리고 출력이 생성되기 전에 거절된 요청에 대해서는 비용이 청구되지 않으며, 다른 모델로 재시도할 경우 전환에 따른 프롬프트 캐시 (prompt cache) 비용이 환불된다는 점입니다.

Fable 5와 Mythos 5의 가용성은 출시 이후 일관되지 않았습니다. 저는 현재 무료 (Free) 플랜을 사용 중인데, 제 모델 선택기 (model picker)에 Fable 5가 "7월 7일까지 포함됨"이라고 표시되어 나타났습니다. 이는 상시 액세스가 아닌 제한된 체험 기간임을 시사합니다. 또한 출시 직후 수출 통제 지침 (export control directive)과 관련된 일시적 중단 보고도 있었습니다. 만약 귀하의 작업이 두 모델 중 하나에 의존한다면, 출시 첫날의 액세스가 유지될 것이라고 가정하기보다는 직접 확인하기 전까지 가용성을 미확정 상태로 간주하는 것이 좋습니다.

빠른 비교

모델	출시일	티어 (Tier)	최적 용도
Claude Sonnet 5	2026년 6월 30일	Sonnet	일상적인 코딩, 에이전트 (agents), 지식 작업, 낮은 비용
...

이번 주에 실제로 해야 할 일

이미 Sonnet 4.6을 사용 중이라면 Sonnet 5로 이동하십시오. 도입 기간 동안 가격은 비용 중립 (cost neutral)에 가까우며, 에이전트적 (agentic) 이점은 미미한 수준이 아니라 실질적입니다.

비용 문제로 인해 Opus에서 프로덕션 워크로드 (production workloads)를 실행하고 있다면, 여전히 Opus가 필요하다고 가정하기 전에 Sonnet 5를 실제 작업에 맞춰 벤치마크 (benchmark)해 보십시오. Anthropic의 자체 수치에 따르면, Sonnet 5는 일부 지식 작업 (knowledge work) 평가에서 Opus 4.8을 약간 상회하는 성능을 보여주었으며, 이는 이전 세대의 Sonnet 모델에서는 나타나지 않았던 현상입니다.

만약 Fable 5 또는 Mythos 5가 선택 가능한 옵션으로 나타난다면, 최소한 액세스 (access)가 안정화될 때까지는 이를 핵심 워크플로 (critical workflow)를 구축할 대상이라기보다는 평가해야 할 대상으로 취급하십시오.

Anthropic의 출시 주기 (release cadence)는 둔화되지 않고 있으며, 새로운 모델이 출시되어 어디에서나 기본값 (default)이 되기까지의 간격은 계속해서 줄어들고 있습니다. 지금은 필요하다고 느껴지는 것보다 더 자주 변경 로그 (changelog)를 확인해 볼 가치가 있습니다.

저는 풀스택 개발자이자 Google I/O 2026 Writing Challenge 수상자인 Tobore입니다. 저는 개발자의 작업 방식을 실제로 변화시키는 도구들에 대해 글을 씁니다. 더 많은 내용은 dev.to/toboreeee 에서 확인하실 수 있습니다.

Insights

Claude Sonnet 5 출시: 변경 사항 및 현재 권장 사용법

요약

핵심 포인트