
2개월 전 제가 작성한 "The Harness Is Everything"가 130만 회의 조회수를 기록했습니다.
요약
Life-Harness 논문에 따르면 모델을 수정하지 않고 하네스(harness)를 패치하는 것만으로도 대다수의 모델-환경 설정에서 성능이 크게 향상되었습니다. 18개의 백본 모델에서 평균 88.5%의 성능 향상을 기록하며 하네스의 중요성을 입증했습니다.
핵심 포인트
- 모델 동결 상태에서도 하네스 패치만으로 성능 개선 가능
- 126개 설정 중 116개에서 성능 향상 확인
- 18개 백본 모델에서 평균 88.5%의 성능 향상 달성
- Claude Code와 Codex의 작동 원리와 연관됨
2개월 전, 저는 "The Harness Is Everything"라는 글을 썼고 130만 회의 조회수를 기록했습니다.
지난주 Life-Harness 논문에 따르면: 126개의 모델-환경 (model-environment) 설정 중 116개가 하네스 (harness)를 패치하는 것만으로 개선되었습니다.
모델은 동결 (frozen)되었습니다. 18개의 백본 (backbones) 전반에 걸쳐 평균 88.5%의 성능 향상 (lift)을 보였습니다.
↓ Claude Code와 Codex가 내부적으로 실제로 작동하는 방식
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Claude/Anthropic의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기