
Claude의 새로운 모델은 실수할 때 더 '정직'해집니다
요약
Anthropic이 새로운 Claude Opus 4.8 모델을 출시하며 모델의 '정직함'을 핵심 가치로 내세웠습니다. 이 모델은 근거 없는 주장을 피하고 자신의 작업에 대한 불확실성을 더 명확히 표시하도록 훈련되었습니다.
핵심 포인트
- Claude Opus 4.8 출시 및 정직성 강화
- 근거 없는 자신감 있는 오답 제시 문제 해결
- 작업에 대한 불확실성을 표시하는 능력 향상
- 이전 모델 대비 근거 없는 주장 빈도 대폭 감소

Anthropic은 목요일에 Claude Opus 4.8을 출시하며, 이 모델의 "정직함 (honesty)"을 강조하고 있습니다.
Anthropic에 따르면, 이들은 "모든 [자사] 모델이 정직하도록 훈련시키며, 예를 들어 뒷받침할 수 없는 주장을 하는 것을 피하도록 합니다." 하지만 이들은 "AI 모델의 일반적인 문제는 때때로 성급하게 결론을 내리고, 근거가 빈약함에도 불구하고 자신의 작업이 진전되고 있다고 자신 있게 제시한다는 점입니다."라고 언급했습니다.
이 AI 연구소는 초기 테스터들이 Opus 4.8이 "자신의 작업에 대한 불확실성을 표시할 가능성이 더 높고, 근거 없는 주장을 할 가능성은 더 낮다는 것을 발견했다"고 주장합니다. 회사의 평가에 따르면, Opus 4.8은 "이전 모델보다 약 4배 적게 ..."
AI 자동 생성 콘텐츠
본 콘텐츠는 The Verge AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기