Claude Opus 4.8: "겸손하지만 실질적인 개선"

요약

Anthropic이 정직함과 신뢰성을 대폭 강화한 Claude Opus 4.8을 출시했습니다. 이 모델은 불확실한 상황에서 답변을 유보함으로써 환각 현상을 줄였으며, 대화 중간 시스템 메시지 삽입 기능을 새롭게 도입했습니다.

핵심 포인트

정직함 강화로 근거 없는 주장 및 환각 현상 감소
코드 결함을 지적하지 않고 넘어갈 확률 4배 감소
대화 중간 시스템 메시지(Mid-conversation system messages) 지원
이전 모델 대비 낮은 오답률 및 높은 불확실성 표시 능력

Claude Opus 4.8: “겸손하지만 실질적인 개선”

2026년 5월 28일

Anthropic이 오늘 Claude Opus 4.8을 출시했습니다. 제가 이 출시 발표에서 가장 마음에 들었던 부분은 다음과 같은 문구입니다:

사용자들은 Opus 4.8이 이전 모델에 비해 겸손하지만 실질적인 개선(modest but tangible improvement)이 이루어졌음을 느끼게 될 것입니다. 아직 해야 할 일이 더 남아 있습니다. 저희는 Opus와 동일한 많은 기능을 더 낮은 비용으로 제공하는 모델을 개발하고 출시하기 위해 노력하고 있습니다.

AI 연구소(AI lab)가 이번 출시를 이전 모델에 대한 사소한 점진적 개선(minor incremental improvement)이라고 솔직하게 설명하는 것을 보니 정말 신선합니다!

정직함(Honesty)이 하나의 테마인 것 같습니다. 해당 발표에서 제가 좋아했던 또 다른 문구는 다음과 같습니다:

Opus 4.8에서 가장 두드러진 개선 사항 중 하나는 정직함(honesty)입니다. 저희는 모든 모델이 정직하도록 훈련합니다. 예를 들어, 스스로 뒷받침할 수 없는 주장을 하는 것을 피하도록 합니다. 하지만 AI 모델의 일반적인 문제는 증거가 부족함에도 불구하고 자신의 작업에서 진전이 있었다고 자신 있게 주장하며 성급하게 결론을 내리는 경우가 있다는 점입니다. 초기 테스터들의 보고에 따르면, Opus 4.8은 자신의 작업에 대한 불확실성을 표시할 가능성이 더 높고, 근거 없는 주장을 할 가능성은 더 낮습니다. 이는 저희의 평가에서도 입증되었으며, Opus 4.8은 이전 모델보다 자신이 작성한 코드의 결함을 지적하지 않고 넘어갈 확률이 약 4배 더 낮게 나타났습니다.

연결된 시스템 카드(system card)에는 다음 내용이 포함되어 있습니다:

Claude Opus 4.8은 사실적 환각(factual hallucination)을 측정하는 가장 직접적인 지표인 모든 벤치마크에서 6개 모델 중 가장 낮은 오답률(incorrect-rate)을 기록했습니다. 이는 더 많은 질문에 정답을 맞히기보다는, 불확실한 질문에 대해 답변을 유보(abstaining)함으로써 주로 달성되었습니다.

모델 특성 (Model characteristics)

4.7 버전 이후로 크게 변한 것은 없습니다.

가격은 Opus 4.5/4.6/4.7과 동일한 수준인 입력 100만 토큰당 $5, 출력 100만 토큰당 $25입니다. "Fast mode"는 그 두 배의 가격이지만, 이는 이전 모델들에 비해 상당히 낮아진 수치입니다. (4.6/4.7의 Fast mode는 $30/$150를 유지하고 있습니다.) 참고로 Fast mode는 연구 프리뷰 (research preview)에 참여 중인 조직만 이용 가능하며, "계정 관리자에게 문의하여 액세스를 요청하십시오"라는 안내가 있습니다.

신뢰할 수 있는 지식 컷오프 (knowledge cutoff)와 학습 데이터 컷오프 (training data cutoff)는 모두 4.7과 동일한 2026년 1월입니다.

컨텍스트 윈도우 (context window)는 여전히 1,000,000 토큰이며, 최대 출력은 128,000 토큰입니다.

Claude Opus 4.8의 새로운 기능 (What’s new in Claude Opus 4.8) 문서에는 몇 가지 흥미로운 세부 사항이 포함되어 있습니다. 제 눈길을 끈 부분은 다음과 같습니다:

대화 중간 시스템 메시지 (Mid-conversation system messages). Claude Opus 4.8은 messages 배열 내에서 사용자 턴 (user turn) 직후에 role: "system" 메시지를 즉시 수락합니다 (배치 규칙에 따름). 이를 통해 긴 대화 도중에 전체 시스템 프롬프트 (system prompt)를 다시 기술할 필요 없이 업데이트된 지침을 나중에 추가할 수 있으며, 이는 이전 턴에서의 프롬프트 캐시 히트 (prompt cache hits)를 보존하고 에이전틱 루프 (agentic loops)에서의 입력 비용을 절감해 줍니다.

Anthropic Python SDK의 업데이트 사항도 참조하십시오. 대화 중간에 시스템 프롬프트를 조종할 수 있다는 점은 정말 강력해 보입니다. 저는 이것이 대화당 단일 시스템 프롬프트를 기대하는 제가 만든 LLM 라이브러리의 추상화 (abstraction)와 호환되지 않을까 걱정했습니다만... 최근의 재설계 덕분에 문제없이 처리할 수 있을 것 같습니다.

더 낮은 프롬프트 캐시 최소값 (Lower prompt cache minimum). Claude Opus 4.8의 최소 캐시 가능 프롬프트 길이는 1,024 토큰으로, Claude Opus 4.7보다 낮아졌습니다.

확인해 보니 4.7의 최소값은 4,096이었습니다.

그리고 몇 마리의 펠리컨들

여기 다섯 가지 사고 단계인 low, medium, high, xhigh, max 단계에서 자전거를 타는 펠리컨들이 있습니다.

이번에는 LLM CLI를 사용하여 실행하고 로그를 마크다운 (Markdown)으로 내보낸 다음, Claude Opus 4.8에게 svg 코드 블록을 페이지 상에 SVG로 렌더링할 수 있는 HTML 도구를 만들도록 시켰습니다.

이것이 최대치입니다. 분명히 가장 뛰어난 성능을 보여주었지만, 입력 25,17,167 토큰과 출력 17,167 토큰을 사용하여 총 43센트의 비용이 들었습니다!

The bicycle and pelican are the right shape. It's a perfectly cromulent image, but it lacks flair.

AI 자동 생성 콘텐츠

원문 바로가기

Claude Opus 4.8: "겸손하지만 실질적인 개선"

요약

핵심 포인트

Claude Opus 4.8: “겸손하지만 실질적인 개선”

모델 특성 (Model characteristics)

그리고 몇 마리의 펠리컨들

댓글