
갓 출시된 Claude Opus 4.8 정리
요약
Anthropic이 성능과 속도 개선을 넘어 '정직함(honesty)'을 핵심 가치로 내세운 Claude Opus 4.8을 공개했습니다. 이번 업데이트는 모델의 불확실성 신고 능력과 코드 결함 탐지율을 대폭 높였으며, 사용자가 사고 수준(effort)을 직접 선택할 수 있는 기능을 포함합니다.
핵심 포인트
- 모델의 정직함 강화로 근거 없는 주장 및 환각 현상 감소
- 코드 결함 간과율을 전 세대 대비 약 1/4 수준으로 개선
- 사용자가 직접 사고 수준(effort)을 선택할 수 있는 컨트롤 추가
- Fast 모드 도입으로 속도 2.5배 향상 및 비용 1/3 절감

출처: Anthropic 공식 블로그 「Introducing Claude Opus 4.8」 인용
이번 기사는 "또 새로운 Claude가 나왔는데, 결국 뭐가 바뀐 거지?"라는 의문에 대해 핵심 요점을 빠르게 파악하는 글입니다.
Claude Opus 4.8이 공개되었습니다 (일본 시간 2026년 5월 29일 / 미국 시간 5월 28일). 이전 버전인 4.7으로부터 불과 6주 만의 업데이트입니다.
이번에 공식 측에서 가장 우선적으로 내세운 것은 성능이나 속도가 아닌 **"정직함 (honesty)"**였습니다. "'정직함'? 그게 무슨 소리지...?"라는 의구심이 들어 요점만 정리해 보았습니다.
- Opus 4.8에서 "결국 무엇이 바뀌었는가"를 대략적으로 파악
- 이번 "정직함"이란 무엇인가 (그리고 테스트 전의 솔직한 소감)
- 3가지 신기능 (effort 선택 / 다이내믹 워크플로우 (Dynamic Workflow) / Messages API)의 개요
- 화제의 "Mythos" 등 향후 전망
Opus 4.8은 "벤치마크 점수도 올랐지만, 그 이상으로 '거짓말을 하기 어려워진'" 모델입니다. Anthropic 스스로도 **"완만하지만, 체감할 수 있는 개선"**이라고 표현하고 있습니다.
| 항목 | 한 줄 요약 |
|---|---|
| 주역 | "정직함". 확신이 없는 부분을 신고하며, 코드 결함 간과율이 전 세대 대비 약 1/4 |
| 신기능 | effort 선택 · 다이내믹 워크플로우 (Dynamic Workflow) · Messages API 업데이트 |
현 시점에서 "오, 괜찮은데"라고 생각한 점은 내용물만 좋아졌다는 점입니다.
공개일: 일본 시간 2026년 5월 29일 (미국 시간 5월 28일) 전 세계 제공 시작 -
위치: Anthropic의 플래그십 "Opus" 계열의 최신 버전
고속 (fast) 모드도 준비되어 있어, 동일한 모델을 약 2.5배의 속도로 구동할 수 있습니다. 게다가 이전의 fast 모드와 비교해 3분의 1 가격이 되어, 속도가 필요한 상황에서의 진입 장벽이 상당히 낮아졌습니다.
이 부분이 이번의 본론이며, 공식 측이 가장 눈에 띄는 개선점으로 꼽고 있는 부분입니다.
실무에서 사용하다 보면, 가끔 근거가 빈약한데도 "했습니다!"라고 자신만만하게 말하는 문제가 있습니다. "아니, 그거 정말 제대로 된 거야?"라며 다시 확인해 본 적 없으신가요? Opus 4.8은 다음과 같은 부분이 개선되었다고 설명되어 있습니다.
- 자신의 작업에 대해 "이 부분은 확신이 없다"라고 불확실성을 신고하기 쉬워짐
- 근거 없는 주장을 하기 어려워짐
- 자신이 작성한 코드의 결함을 놓치지 않고 지적할 확률이 전 세대 대비 약 4배 증가
...까지가 공식과 미디어의 주장입니다.
정말일까 의구심이 드는 저도 있습니다 (작은 목소리).
Claude의 모델 선택란 옆에, **"Claude가 얼마나 생각할지 (effort)를 선택하는 컨트롤"**이 추가되었습니다. Claude Code에는 이전부터 effort (/effort, 5단계)가 존재해 왔으며, 이번에 그것을 Claude (즉, Web · 데스크톱 앱 · 모바일)에서도 선택할 수 있게 된 것이 새로운 점입니다.
| effort | Claude Code 표기 | 이럴 때 |
|---|---|---|
| low | low | 빠르게 답을 얻고 싶을 때 / 레이트 리밋 (Rate Limit)을 절약하고 싶을 때 |
| medium | medium | 비용을 중시하며, 품질을 다소 양보해도 괜찮을 때 |
| high ※기본값 | high | 일상적인 사용. 품질과 속도의 밸런스형 |
| extra | xhigh | 어려운 태스크 · 장시간 실행하는 작업 (Claude Code의 권장 기본값) |
| max | max | 품질 최우선. 단, 과도한 생각 (overthinking)에 빠질 수도 있음 |
Claude는 high가 기본값이며, low~max 중에서 선택할 수 있습니다. 표기는 환경에 따라 조금 다르며, Claude의 "extra"가 Claude Code의 "xhigh"에 해당합니다.
포인트는, 기본값인 "high"에서도 코딩 시에는 4.7과 거의 동일한 토큰량을 유지하면서 성능이 올라갔다는 점입니다. 표에 나와 있듯이 max는 과도한 생각 (overthinking)이 발생할 수도 있으므로, "가장 높은 단계가 무조건 최강"은 아닙니다.
Claude Code가 큰 태스크를 스스로 계획하고, 수백 개의 서브 에이전트 (Sub-agent)를 병렬 실행한 뒤 자기 검증을 해주는 기능입니다. 공식 예시는 "수십만 행 규모의 코드베이스 이전을 착수부터 머지 (Merge)까지" 수행하는 것이었습니다.
↑ 실행 중인 화면이라고 합니다. 큰 태스크를 여러 페이스 (Phase)로 나누고, 각 페이스에서 여러 서브 에이전트 (Sub-agent, 모두 Opus 4.8 · 1M context)가 병렬로 파일을 처리합니다. 각 에이전트의 토큰량이나 툴 호출 (Tool call) 수까지 시각화됩니다.
*출처: Introducing dynamic workflows in Claude Code (Anthropic 공식)
이는 개발자용 변경 사항입니다. 공식에 따르면, Messages API의 메시지 배열 안에 system 엔트리를 둘 수 있게 되었다고 합니다.
목표는 "태스크 도중에 지시를 교체하기 쉽게 만드는 것"입니다. 기존에는 도중에 지시를 바꾸려면 사용자 측의 발언 (User turn)을 끼워 넣어야 했으며, 이것이 프롬프트 캐시 (Prompt Cache)를 깨뜨리는 원인 중 하나였습니다. 이번 업데이트에서는 사용자 턴을 거치지 않고, 캐시를 깨뜨리지 않으면서 가동 중인 Claude에게 지시를 업데이트할 수 있다고 합니다. 공식이 제시하는 활용 사례는 에이전트를 구동하는 도중에 권한 · 토큰 예산 · 환경 (컨텍스트) 정보를 교체하는 등의 케이스입니다.
(출처: Anthropic 공식 블로그 「Introducing Claude Opus 4.8」)
SWE-Bench Pro (코딩 계열): 69.2% (Opus 4.7의 64.3%에서 개선) - 컴퓨터 조작 · 브라우저 조작 계열에서도 테스터 환경에서 이전 세대나 GPT-5.5를 상회하는 스코어가 보고됨

Anthropic 공식 블로그 「Introducing Claude Opus 4.8」에서 인용
"엄청나게 뛰어올랐다!"라기보다는 착실하게 쌓아 올렸다는 인상입니다. 공식 블로그에 달린 테스터들의 코멘트에서도, Cursor는 툴 호출이 효율화되어 동일한 지능이라도 손수 (Step)가 줄었다고 언급했으며, Cognition은 4.7에서 신경 쓰였던 코멘트의 장황함이나 툴 호출 문제가 해결되었다고 말했습니다. 전체적으로 현실적인 목소리가 많았습니다.
Anthropic은 다음 두 가지를 예고했습니다.
- Opus와 동등한 능력을 더 낮은 비용으로 제공하는 모델 개발
- Opus를 상회하는 지능을 가진 새로운 클래스 「Mythos」 투입 (향후 수주 내에 모든 고객에게 제공 예정)
"향후 수주 내에"라는 말은 공식 블로그의 다음 구절을 근거로 합니다.
"…bring Mythos-class models to all our customers in the coming weeks."
(…Mythos 클래스의 모델을 향후 수주 내에 모든 고객에게 제공할 수 있을 것으로 전망)
── Introducing Claude Opus 4.8 보다
현재 화제가 되고 있는 Mythos는, Project Glasswing의 일환으로 일부 조직이 사이버 보안 용도로 「Claude Mythos Preview」를 이용 중이며, 일반 제공에는 더욱 강력한 사이버 안전책 마련이 필요하다고 합니다.
공식은 수주 내라고 말하지만, "어차피 늦어지겠지~", "이래저래 말이 많아지겠지"라고 생각하면서도, "얼마나 대단할까"라며 기대하는 제 자신도 있습니다.
※ 「Project Glasswing (프로젝트 글래스윙)」이란, Anthropic사가 주도하는 업계 횡단형 사이버 보안 이니셔티브입니다. Apple, Google, Microsoft 등 세계적인 대기업 12사가 참여하며, 해당 회사의 차세대 AI 모델 「Claude Mythos Preview」를 활용하여 중요 인프라나 OSS의 취약성을 선제적으로 탐지 · 수정하는 것을 목표로 합니다.
갓 출시된 Claude Opus 4.8을 정리해 보았습니다.
- 주인공은
"정직함". 자신의 실수나 불확실한 부분을 신고하기 쉬워짐 - 신기능은
effort 선택 · 다이내믹 워크플로우 · API 업데이트의 3가지 축 - 고속 (fast) 모드는
2.5배속 · 1/3 가격으로 사용 가능 - 다음은
더 저렴한 Opus급과, 그 이상의 Mythos 클래스가 대기 중
"약간의 진화"이기는 하지만, AI가 "정직해지는" 방향으로 움직이는 것을 적극적으로 테스트하며 실감해 보고 싶습니다. 빠르게 캐치업하고 싶은 분들을 위해 정리했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기