Claude Fable 5의 능력이 눈에 띄게 약화되었으며, 그 실체가 밝혀졌습니다!

Claude Fable 5의 능력이 눈에 띄게 약화되었으며, 그 실체가 밝혀졌습니다!
Anthropic은 여러분에게 얼마나 많은 사과와 설명을 해야 할까요!

Claude Fable 5는 Anthropic이 출시한 "대중용 Mythos 버전"으로, 기반은 Mythos 모델이지만 안전 보호 장치(Safety Guardrails)가 추가되었습니다.
Mythos는 "너무 강력해서 직접 출시할 수 없는" 모델입니다.

잘 모르는 분들을 위해 대략적으로 설명하자면:

Fable 5의 초기 버전(7월 1일 이전)은 성능이 매우 좋았습니다.
하지만 이후 Anthropic이 안전 보호를 강화했습니다: 사이버 보안 보호를 위해 코드 보안 검토가 포함된 작업은 즉시 Opus 4.8로 성능이 하락(Fallback)됩니다.

최첨단 LLM 개발 보호 — 사용자가 Fable 5를 사용하여 새로운 모델을 개발할 때, 몰래 프롬프트(Prompt)를 수정하여 잘못된 결과를 생성하는 행위 (이것이 발견된 후 사과했습니다)

생화학 보호 — 생화학 관련 작업도 제한되었습니다.

BridgeBench의 테스트 결과:

디버깅(Debugging) 능력 폭락: 86.2 → 25.9 (70% 감소)

리팩토링(Refactoring) 능력 반토막: 73.6 → 38.4 (48% 감소)
환각(Hallucination) 제어 악화: 75.9 → 61.7 (19% 감소)

즉, 안전 보호 장치가 과도하게 트리거(Trigger)되고 있다는 뜻입니다.

많은 정상적인 프로그래밍 작업들도 "고위험"으로 오판되어, 더 낮은 성능의 Opus 4.8로 성능이 하락하게 됩니다.

사용자들은 Fable 5의 비용(Opus 4.8의 두 배 가격)을 지불하고 있지만, 실제로는 Opus 4.8의 성능을 사용하고 있는 것입니다.

그런데, Anthropic은 모르는 척하고 있다고요?
[IMG:1]

Insights