Claude Fable 5 사용 첫날의 견해——도구는 능력의 최고치가 아니라, 작업과의 '중첩'으로 측정한다

본 기사는 Fable 5 공개 다음 날, 실제 사용 첫날에 작성한 기록이다. 관찰이 쌓이기 전, 추론 단계에서의 견해를 그대로 남긴다. 맞든 틀리든, 이후 검증의 기준점이 된다.

2026년 6월 9일, Anthropic이 Claude Fable 5를 공개했다. Mythos와 동일한 기반 모델(Base Model)에 안전장치를 결합하여 일반에 개방한 첫 번째 Mythos 클래스 모델이다. "지금까지 제공된 그 어떤 모델보다 뛰어난 능력"이라고 표방하며, 벤치마크에 따라서는 Opus 4.8을 10% 이상 상회한다고 한다.

새로운 도구가 나오면 성능을 보고 싶어진다. 하지만 물어야 할 것은 "이 도구가 얼마나 고성능인가"가 아니다. **"이 도구의 고성능인 부분이 내가 실제로 하는 작업과 중첩되어 있는가"**이다. 성능의 최고치는 자신의 작업과 중첩되지 않으면 의미를 갖지 못한다.

이 기사는 Fable 5를 나 자신의 워크플로(Workflow)라는 척도로 측정한 기록이다.

보도와 공식 발표를 대조해 보면, Fable 5의 능력 증분은 명확하게 한 지점에 집중되어 있다. 바로 장시간·자율적인 에이전트(Agent) 작업이다.

AWS의 설명에 따르면 "에이전트 환경 안에서 수일 단위로 계속 움직이며, 계획을 세우고, 목표에 대한 진척도를 점검하며, 작업을 다시 다듬는다"라고 한다.
Stripe는 수개월 분량의 엔지니어링 작업을 수일로 압축했다고 보고했다. Fable 5는 2개월 이상 걸리는 대규모 Ruby 코드베이스 이전을 완수했다고 한다.
소프트웨어 엔지니어링, 지식 노동, 비전, 과학 연구에서 "탁월한 성능"을 보이며, 특히 길고 복잡한 태스크(Task)에서 Opus 모델을 상회한다.

즉 Fable 5의 진가는 **"인간이 몇 번이고 끼어들지 않아도, 긴 작업을 단번에 끝까지 실행한다"**는 점에 있다.

한편 제약도 있다. 사이버 보안, 생물, 화학, 증류(Model Distillation)와 관련된 고위험 질문은 Fable 5가 아니라 Opus 4.8로 자동 배정된다. 안전장치가 작동하는 비율은 평균적으로 전체 세션의 5% 미만이라고 한다. 나의 용도와는 무관한 영역이지만, 구조로서 알아둘 가치는 있다.

여기서 자신의 작업을 솔직하게 분해해 본다. 내가 AI를 상대로 하고 있는 일은 거의 세 종류로 수렴한다.

타겟을 좁힌 Q&A——일문일답. 사실 확인, 계산 검증, 개념에 대한 브레인스토밍(Wall-hitting).
단발성 스크립트 생성——gear_analyzer.py와 같은 측정 도구를 하나씩 만들거나 수정함.
기사 초안 작성——Qiita 기사를 논의를 다듬어가며 써 내려감.

이 세 가지의 공통점은 모두 "짧은 왕복"으로 완결된다는 것이다. 한 번의 작업이 수일에 걸쳐 자율적으로 계속 실행되는 형태가 아니다. 내가 질문하고, AI가 답하고, 내가 판단한다. 그 반복이다.

여기서 두 개의 도형을 겹쳐 본다. Fable 5의 능력 증분은 "장시간·자율 에이전트 작업"에 집중되어 있다. 나의 워크플로는 "짧은 왕복"으로 이루어져 있다.

중첩이 작다.

이는 성능을 의심하는 것이 아니다. Fable 5가 강력한 것은 사실이다. 하지만 그 강점이 가장 발휘되는 장면——수 시간에서 수일 동안 인간의 개입 없이 계속 실행되는 작업——을 나는 애초에 작업으로서 가지고 있지 않다.

gear_analyzer.py의 개수를 예로 들면, 그것은 내가 구조를 숙지하고 몇 번이고 손을 댄 코드다. 한 번의 개수는 "이 부분을 이렇게 고친다"라는 짧은 왕복으로 끝난다. 이를 Fable 5에게 맡겨도 결과는 "왕복이 조금 줄었다" 정도의 차이일 뿐이다. 이전 모델에서도 v3.7까지 만들 수 있었다는 사실이 이를 뒷받침한다.

기사 집필도 마찬가지다. 긴 문맥을 유지하는 힘은 확실히 올라갔다. ⑭까지 쌓아 올린 논의와 모순되지 않게 ⑳를 쓴다는 제약에는 효과적이다. 하지만 나의 방식은 한꺼번에 전부 쓰게 하는 것이 아니라, 단락마다 다듬으며 확인하는 방식이다. 여기서도 "짧은 왕복"이 기본이다.

꼭 그렇지만은 않다. 중첩이 작은 것은 "현재"의 워크플로와 관련된 이야기다.

만약 내가 지금까지 손대지 않았던 종류의 작업에 발을 들인다면 이야기는 달라진다. 예를 들어——

구조적 조망이 필요한 신규 소프트웨어. 길들이기 중인 전류 증가와 모터 브러시 열화를 구분하여 기록하는 Arduino 계측 측 소프트웨어 등, 처음부터 설계의 일관성을 관통해야 하는 작업.
긴 이론적 검증. 저 레이놀즈 수(Low Reynolds number) 주변의 BEM 계산처럼, 여러 단계 앞까지 정합성을 유지하며 진행해야 하는 작업.

이러한 "신규성이 있고, 전망이 긴" 대상이야말로 Fable 5의 "여러 단계 앞까지 일관성을 유지하는" 힘이 살아나는 곳이다. 역설적으로 말하면, Fable 5는 나의 워크플로를 변화시키는 유인(Incentive)은 될 수 있지만, 지금의 워크플로를 빠르게 만드는 도구는 아니다라는 것이 정확한 평가다.

평가에는 비용이 따른다. Fable 5는 입력 100만 토큰당 10달러, 출력 50달러다. Mythos Preview의 절반 이하 가격이라고는 하지만, 결코 싸지 않다.

제공 조건도 특수하다. Pro/Max/Team/Enterprise의 각 플랜에 6월 22일까지 포함되지만, 6월 23일 이후에는 플랜에서 제외되며 이용을 위해서는 크레딧 (Credit)이 필요하게 된다. 용량이 확보되는 대로 플랜에 재추가할 예정이라고 한다.

즉, **"실질적으로 무료로 체험할 수 있는 것은 6월 22일까지"**다. 이는 판단 재료로서 매우 중요하다. AI 메모리 가격의 급등으로 DDR5 증설을 미뤘을 때와 마찬가지로, 비용과 효과를 저울질해야 하는 상황이다.

정리하자면 다음과 같다.

Fable 5의 강점은 장시간·자율 에이전트 (Autonomous Agent) 작업에 집중되어 있다.
나의 워크플로 (Workflow)은 짧은 왕복으로 이루어져 있으며, 중첩되는 부분이 작다.
따라서 "현재의 작업을 빠르게 만드는 도구"로서의 가치는 한정적이다.
다만 "새로운 종류의 작업으로 나아가는 유인 (Incentive)"로서는 가치가 있다.
무료로 확인할 수 있는 것은 6월 22일까지다.

새로운 도구가 나왔을 때 가장 어리석은 태도는 "성능이 높으니까 사용한다"도, "나와는 상관없으니 무시한다"도 아니다. 자신의 작업 형태를 정확히 파악하고, 도구의 강점과 대조하여, 중첩되는 부분만을 최대한 활용하는 것이다.

성능의 최고치에 눈을 빼앗기지 않고, 자신의 현장과의 중첩도로 측정한다. 지도가 정확하다면 도구는 망설임 없이 선택할 수 있다.

솔직히 써두겠다. 본 기사의 핵심인 "짧은 왕복으로는 차이가 나기 어렵다"는 현 시점에서는 **검증 전의 추론 (Inference)**이다. 나는 오늘 처음으로 Fable 5를 사용했다. 아직 관찰 데이터는 없다.

6월 22일까지의 무료 기간 동안 실제 작업——스크립트 상담, 기사 협업, 일문일답——을 통해 확인하겠다. 왕복은 줄었는가? 놓치는 부분은 줄었는가? 이전 모델과 무엇이 달랐는가? 결과는 후속편에 쓰겠다. 만약 이 예측이 틀렸다면, 틀린 이유와 함께 기술하겠다.

본 기사는 2026년 6월 10일 시점의 공개 정보에 기반한다. Fable 5의 제공 조건 및 가격은 변경될 가능성이 있다.

Claude Fable 5 사용 첫날의 견해——도구는 능력의 최고치가 아니라, 작업과의 '중첩'으로 측정한다

요약

핵심 포인트

댓글