Anthropic, 코딩·정확성 강화한 ‘Claude Opus 4.8’ 공개

요약

Anthropic이 코딩 능력과 정직성이 대폭 강화된 최신 모델 Claude Opus 4.8을 공개했습니다. 이 모델은 SWE-Bench Pro에서 높은 성적을 거두었으며, 에이전트 작업과 다학제적 추론 능력이 향상되었습니다.

핵심 포인트

코딩 결함 간과 가능성이 이전 모델 대비 4배 감소
SWE-Bench Pro에서 69.2% 기록하며 GPT-5.5 및 Gemini 3.1 Pro 능가
Fast 모드 도입으로 속도 2.5배 향상 및 비용 3배 절감
Dynamic workflows를 통한 대규모 코드베이스 마이그레이션 지원

출처 1: https://www.macrumors.com/2026/05/28/anthropic-claude-opus-4-8/

Anthropic, 코딩·정확성 강화한 ‘Claude Opus 4.8’ 공개

Anthropic Launches Claude Opus 4.8 With Gains in Coding and Honesty

Anthropic은 오늘 최신 AI 모델인 Claude Opus 4.8의 출시를 발표했습니다. Anthropic은 이 모델이 에이전트 코딩, 다학제적 추론, 에이전트 컴퓨터 사용, 지식 작업, 에이전트 금융 분석 분야에서 개선된, "더 효과적인 협업자"라고 주장합니다.

테스터들은 Opus 4.8이 에이전트 작업을 수행할 때 "더 신뢰할 수 있고 판단력이 날카롭다"고 평가했으며, 이 모델은 정직도에서도 향상을 보였습니다.

초기 테스터들은 Opus 4.8이 자신의 작업에 대한 불확실성을 표시할 가능성이 더 높고, 근거 없는 주장을 할 가능성이 낮다고 보고했습니다. 이는 저희의 평가에서도 입증되었는데, Opus 4.8은 자신이 작성한 코드의 결함을 무심히 지나치게 할 가능성이 이전 모델보다 약 네 배나 낮습니다.

정렬 평가에 따르면, 이 모델은 사용자 자율성 지원 및 사용자의 최선의 이익을 위해 행동하는 것과 같은 친사회적 특성 측정 항목에서 새로운 최고치를 기록했습니다. 기만과 같은 정렬되지 않은 행동률은 Opus 4.7보다 낮으며 Claude Mythos Preview와 유사합니다.

Anthropic의 벤치마크에 따르면, Opus 4.8은 SWE-Bench Pro에서 69.2%를 기록하여 테스트 및 여러 다른 벤치마크에서 GPT–5.5와 Gemini 3.1 Pro를 능가했지만, 터미널 코딩 벤치마크에서는 GPT–5.5가 선두를 차지했습니다.

Opus 4.8의 Fast 모드 역시 속도가 2.5배 빠르며, 이전 모델보다 비용이 세 배 저렴해졌습니다.

Opus 4.8과 함께 Anthropic은 제품 라인업에 새로운 기능을 추가하고 있습니다.

Dynamic workflows (research preview)- Claude는 Claude Code에서 더 큰 작업을 완료할 수 있습니다. 단일 세션에서 작업을 계획하고 수백 개의 병렬 서브 에이전트를 실행할 수 있습니다. 수십만 줄의 코드를 가로지르는 코드베이스 규모의 마이그레이션도 완료할 수 있습니다. 이 기능은 Claude Code for Enterprise, Team, 그리고 Max 플랜에서 이용 가능합니다.
Effort control- Claude.ai와 Cowork에서 사용자는 Claude가 응답에 얼마나 많은 노력을 기울일지 선택할 수 있습니다. 설정을 낮추면 Claude가 더 빠르게 응답하고 사용량 제한을 더 느리게 소모합니다. Opus 4.8은 기본적으로 높은 노력을 사용하도록 설정되어 있으며, Anthropic은 이것이 품질과 사용자 경험의 최적의 균형이라고 말합니다.
Messages API- Messages API는 messages 배열 내부에 system entries를 허용하여 개발자가 작업 도중에 Claude의 지침을 업데이트할 수 있게 합니다.

Claude Opus 4.8은 오늘 모든 곳에서 이용 가능합니다. 일반 사용에 대한 가격은 Opus 4.7과 비교하여 변경되지 않았습니다.

Anthropic은 더 낮은 비용으로 Opus 4.8과 동일한 기능을 갖춘 모델과 Opus보다 훨씬 더 지능적인 새로운 클래스의 모델을 개발하고 있습니다. Anthropic은 소수의 조직과 테스트 중인 Claude Mythos 모델에 대한 안전장치를 개발해 왔으며, Mythos급 모델을 모든 고객에게 "향후 몇 주 내에" 제공할 수 있을 것으로 기대하고 있습니다.

원문 출처: MacRumors

※ 해당 기사는 퀘이사존 공식 기사가 아닌 해외 뉴스/기사를 번역한 기사입니다.
퀘이사존 견해와 주관은 포함되어 있지 않습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Anthropic, 코딩·정확성 강화한 ‘Claude Opus 4.8’ 공개

요약

핵심 포인트

댓글