
FABLE 5가 성능 저하(Nerfed)된 상태로 돌아왔습니다.
요약
BridgeBench 테스트 결과, Claude Fable 5 모델의 성능이 이전 버전 대비 크게 하락한 것으로 나타났습니다. 디버깅과 리팩토링 성능이 급감했으며, 이는 과도한 가드레일 적용과 모델 폴백 문제로 분석됩니다.
핵심 포인트
- Fable 5의 디버깅 성능이 86.2에서 25.9로 급락
- 리팩토링 성능 또한 73.6에서 38.4로 크게 저하
- 과도한 가드레일 적용 및 Opus 4.8로의 폴백 의심
- Anthropic의 모델 성능 변화에 대한 설명 요구
FABLE 5가 성능 저하(Nerfed)된 상태로 돌아왔습니다.
우리는 BridgeBench에서 7월 1일 버전의 Claude Fable 5를 다시 실행했습니다.
결과는 참혹합니다:
디버깅 (Debugging): 86.2 → 25.9
리팩토링 (Refactoring): 73.6 → 38.4
환각 (Hallucination): 75.9 → 61.7
새로운 가드레일 (Guardrails)이 너무 많은 작업에 적용되고 있으며, Opus 4.8로 폴백 (Fallback)되고 있습니다.
이것은 차단되었던 그 모델이 아닙니다.
Anthropic은 모두에게 설명을 해야 합니다.
[IMG:1]
AI 자동 생성 콘텐츠
본 콘텐츠는 X 토픽: Claude/Anthropic의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기