The헤드라인2026. 05. 29. 02:03

Claude의 새로운 모델은 실수할 때 더 '정직'해집니다

요약

Anthropic이 새로운 Claude Opus 4.8 모델을 출시하며 모델의 '정직함'을 핵심 가치로 내세웠습니다. 이 모델은 근거 없는 주장을 피하고 자신의 작업에 대한 불확실성을 더 명확히 표시하도록 훈련되었습니다.

핵심 포인트

Claude Opus 4.8 출시 및 정직성 강화
근거 없는 자신감 있는 오답 제시 문제 해결
작업에 대한 불확실성을 표시하는 능력 향상
이전 모델 대비 근거 없는 주장 빈도 대폭 감소

Anthropic은 목요일에 Claude Opus 4.8을 출시하며, 이 모델의 "정직함 (honesty)"을 강조하고 있습니다.

Anthropic에 따르면, 이들은 "모든 [자사] 모델이 정직하도록 훈련시키며, 예를 들어 뒷받침할 수 없는 주장을 하는 것을 피하도록 합니다." 하지만 이들은 "AI 모델의 일반적인 문제는 때때로 성급하게 결론을 내리고, 근거가 빈약함에도 불구하고 자신의 작업이 진전되고 있다고 자신 있게 제시한다는 점입니다."라고 언급했습니다.

이 AI 연구소는 초기 테스터들이 Opus 4.8이 "자신의 작업에 대한 불확실성을 표시할 가능성이 더 높고, 근거 없는 주장을 할 가능성은 더 낮다는 것을 발견했다"고 주장합니다. 회사의 평가에 따르면, Opus 4.8은 "이전 모델보다 약 4배 적게 ..."

전체 기사는 The Verge에서 확인하세요.

AI 자동 생성 콘텐츠

원문 바로가기

Claude의 새로운 모델은 실수할 때 더 '정직'해집니다

요약

핵심 포인트

댓글