
Claude Fable 5를 활용하는 엔지니어를 위한 가이드 — 프롬프트와 스캐폴딩(scaffolding)의 핵심
요약
Claude Fable 5를 활용하여 에이전트를 개발하는 엔지니어를 위한 프롬프트 및 스캐폴딩 가이드입니다. 기존 모델과 달리 effort 파라미터를 통한 적응적 사고 조절과 불필요한 지시문 삭제를 통한 최적화 방법을 다룹니다.
핵심 포인트
- budget_tokens 대신 effort 파라미터로 지능, 레이턴시, 비용을 조절
- 정밀도가 필요한 작업에만 xhigh 설정을 권장하며 기본은 high 사용
- 지시 추종 능력이 강화되어 구모델용 장황한 프롬프트는 오히려 품질 저하 유발
- 동작하는 최소한의 기능만 수행하도록 프롬프트를 간결하게 유지
Claude Fable 5에 대한 화제는 「벤치마크가 높다」는 점만이 앞서기 쉽지만, 실제로 일상적인 에이전트 개발에서 효과를 발휘하는 것은 프롬프트와 스캐폴딩(scaffolding: 모델을 구동하는 주변 메커니즘)의 방식이 바뀌었다는 점입니다. 구모델(Opus 4.8 등)의 감각 그대로 던지면, 오히려 품질을 떨어뜨리는 케이스조차 있습니다.
이 기사는 Anthropic 공식의 Prompting Claude Fable 5를 축으로, 엔지니어가 오늘부터 바로 적용할 수 있는 핵심 포인트만을 뽑아 정리한 것입니다. 입문용 기사가 아니므로, Claude Code나 API로 에이전트를 구성하고 있다는 전제하에 진행합니다.

1. 효과를 내는 법: budget이 아니라 effort
우선, 인터넷상에 떠도는 "Fable 5는 budget_tokens를 사용하여 사고량을 4000~6000 정도로..."와 같은 종류의 해설은 그대로 믿지 않는 것이 좋습니다. 공식 문서에 따르면, Fable 5는 adaptive thinking (적응적 사고)만 지원하며, 확장 사고의 예산 지정(budget_tokens)은 폐지되었습니다.
대신, 지능·레이턴시(응답 지연)·비용의 트레이드오프(trade-off)를 조절하는 주역은 effort (노력도) 파라미터입니다.

high를 기본값으로 설정해 두는 것이 무난합니다. 고민된다면 이것을 선택하세요.- 가장 정밀도가 필요한 작업만
xhigh로 설정. - 정형화된 작업이나 인터랙티브하게 빠르게 돌리고 싶을 때는
medium/low.
흥미로운 점은, Fable 5의 낮은 effort로도 구모델의 xhigh를 상회하는 경우가 많다는 점입니다. 무턱대고 높일 필요는 없습니다. "태스크는 완료되지만 느리다"고 느껴진다면, 먼저 effort를 낮추는 것이 정답입니다.
또한 high effort에서는 요청하지 않은 정리나 리팩터링(refactoring)까지 과하게 들어가는 경향이 있습니다. 이를 억제하고 싶다면, 동작을 하나씩 금지하는 것이 아니라 다음과 같이 짧게 덧붙이는 것만으로도 효과적입니다 (공식 예시를 요약).
버그 수정에 주변 정리는 필요 없다. 원샷(one-shot) 처리에 헬퍼는 필요 없다. 가상의 미래 요구사항을 위해 설계하지 마라. 동작하는 최소한만 수행하라.
2. 구모델용 지시는 오히려 "지워라"
이 부분이 가장 놓치기 쉬운 전환 포인트입니다. Fable 5는 지시 추종(instruction following)이 강화되었기 때문에, 동작을 하나하나 열거하지 않아도 짧은 한마디로 대략적인 steer (유도)가 가능합니다.
역설적으로, 구모델을 위해 과하게 덧붙인 장대한 프롬프트나 Skill은 Fable 5에서 오히려 출력 품질을 떨어뜨릴 수 있습니다. 공식에서도 "오래된 지시는 재검토하고, 기본 동작으로 충분하다면 삭제하라"고 명확히 밝히고 있습니다.

예를 들어 "장황하게 설명하지 말 것·불렛 포인트를 너무 많이 쓰지 말 것·PR 설명을 너무 많이 넣지 말 것..."과 같이 개별적으로 나열하는 대신, 다음과 같이 한 문장만 넣어도 동일한 효과를 얻을 수 있습니다.
먼저 결론부터. 첫 문장은 "무슨 일이 일어났는지/무엇을 알게 되었는지"에 답한다. 상세 내용과 이유는 그 다음에. 가독성과 간결함은 별개의 문제이며, 가독성을 우선한다.
이전 작업으로서, 기존의 system 프롬프트나 Skill을 "뺄셈"의 관점에서 감사(audit)하는 것을 추천합니다. 더하는 것보다 빼는 것이 효과적인 단계에 진입했습니다.
3. "사고 과정을 본문에 쓰게 하는" 지시는 지뢰
이것은 모르면 빠지기 쉽습니다. Fable 5에는 **안전 분류기(위험한 출력을 판정하는 필터)**가 들어있는데, 그중 하나가 reasoning_extraction (모델의 내부 추론 추출) 카테고리입니다.
즉, "생각한 과정을 본문에 전부 써줘", "reasoning을 응답에 전사해줘"와 같은 show-your-thinking 계열의 지시는 이 거부 카테고리에 걸리게 되며, 결과적으로 Opus 4.8로의 자동 폴백(fallback)이 증가하게 됩니다.

추론의 시각화가 필요하다면, 본문에 쓰게 하는 것이 아니라 adaptive thinking의 thinking 블록을 읽는 것이 올바른 방식입니다. 전환 시에는 기존 Skill / system 프롬프트에 "자신의 사고를 설명하라" 계열의 지시가 섞여 있지 않은지 한 번 감사해 두시기 바랍니다. 은근히 효과가 큽니다.
4. 장시간 실행을 전제로 스캐폴딩을 재구성하기
Fable 5는 1회 요청이 수 분~수 시간 동안 실행될 수 있습니다 (장기 에이전트 운용). 이때 코드 측의 스캐폴딩이 기존 방식 그대로라면 사고가 발생합니다.
- 클라이언트의 timeout(타임아웃)·streaming(스트리밍)·진행 상황 표시를 먼저 수정할 것. 블로킹(Blocking) 방식으로 기다리는 것을 그만두고, 스케줄링 작업(Scheduled job) 등을 통해 비동기적으로 체크하는 구성으로 전환한다. -
진행 상황의 「날조」 대책. 장시간 실행 시, 모델이 실제 도구(Tool) 결과와 일치하지 않는 진행 상황을 보고할 수 있습니다. 공식 측은 다음과 같이 지시하면 급격히 줄어들었다고 합니다.
진행 상황을 보고하기 전에, 각 주장을 이 세션의 도구 결과와 대조하여 감사(Audit)하라. 증거를 제시할 수 있는 작업만 보고하고, 검증되지 않았다면 미검증 상태임을 명시하라.
- 임의적인 액션 억제. 요청하지 않은 이메일 초안 작성이나, 방어적인 git 브랜치 생성 등을 수행할 때가 있으므로 경계를 명시합니다.
사용자가 문제를 설명하고 있거나, 질문하고 있거나, 생각을 입 밖으로 내뱉고 있는 상태라면, 결과물은 「당신의 소견」이다. 소견을 보고하고 멈춰라. 요청받기 전까지는 수정을 가하지 마라.
5. 병렬 서브 에이전트(Sub-agent) & 메모리를 적극적으로 활용
Fable 5는 서브 에이전트 파견(Delegation)이 이전 모델보다 능숙하여, 더 쉽게 던져줄 수 있습니다.
- 독립적인 서브 태스크는 **계속해서 서브 에이전트에게 위임(Delegation)**하고, 실행 중인 상태에서 본체는 다음 단계로 진행한다. 오케스트레이터(Orchestrator)와 서브 에이전트는 비동기 통신으로 연결한다. 수명이 긴 서브 에이전트는 컨텍스트(Context)를 유지할 수 있으므로, 캐시 읽기를 통해 비용과 시간을 절약할 수 있다. -
검증은 「자기 비판」보다 「별도의 서브 에이전트」가 더 강력하다. Fresh context(완전히 새로운 문맥)를 가진 검증 역할의 서브 에이전트에게, 사양에 비추어 자신의 성과를 체크하게 하는 것이 공식 권장 사항이다. -
메모리 시스템을 갖출 것. 1 교훈 = 1 파일, 맨 앞에 요약 1줄. 과거 실행의 배움을 Markdown에 저장하여 참조하게 하면, Fable 5는 특히 성능이 향상됩니다.
6. 사용처: Sonnet과 Fable 5의 구분
모든 작업을 Fable 5로만 처리하는 것은 비용 측면에서 비효율적입니다. 대략적인 판단 기준은 다음과 같습니다.

- 단일 턴(Single-turn)으로 끝나거나 5단계 이하의 작업은 가벼운 모델(Sonnet 등)로 충분하다. -
10단계 이상을 자율적으로 수행하거나 / 실패의 대가가 큰 작업은 Fable 5를 사용한다. -
Model mixing(추론이 무거운 부분만 Fable 5, 실행 및 정형화는 가벼운 모델)을 통해 비용을 크게 낮출 수 있다.
그리고 평가할 때의 철칙은 **「난이도 범위의 '위'에서부터 테스트하라」**입니다. 간단한 태스크로만 측정하면 Fable 5를 과소평가하게 됩니다. 인간이라면 수 시간~수 일이 걸릴 작업(대규모 마이그레이션, 다단계 분석, 복잡한 에이전트 플로우)에서 진정한 실력이 드러납니다.
7. 안전 분류기(Safety Classifier)에 걸릴 수 있음
마지막으로 운용상의 주의사항입니다. Fable 5의 안전 분류기는 **공격적인 사이버 보안, 생물/생명 과학, 사고 추출(Thought extraction)**을 대상으로 합니다. 까다로운 점은, 무해한 작업(일반적인 보안 구현이나 유익한 라이프 사이언스 처리)에서도 드물게 걸릴 수 있다는 것입니다.
대책은 간단합니다. 서버 측 / 클라이언트 측에서 Opus 4.8로의 폴백(Fallback)을 설정하고, stop_reason: "refusal"을 포착하여 자동으로 넘기도록 구성합니다. 이 부분을 설계해 두면, 가끔 발생하는 거부(Refusal)로 인해 운용이 중단되는 것을 막을 수 있습니다.
요약
Fable 5로 전환할 때의 핵심을 한 문장으로 요약하면, 「똑똑해진 만큼, 발판(Scaffolding)과 지시사항을 "뺄셈"하라」 입니다.
- 사고량은
budget이 아니라 (budget_tokens은 폐지됨)effort로 조절 - 이전 모델을 위한 과도한 지시나 Skill은 오히려 덜어낼 것
show-your-thinking계열의 지시는 거부를 유발할 수 있으므로 제외- 장시간 실행을 전제로 timeout / 비동기 / 진행 상황 감사를 재설계
- 병렬 서브 에이전트와 외부 메모리를 적극 활용
- Sonnet과 Fable 5를 구분하여 사용하고, 평가는 난이도가 높은 것부터 수행
- **Opus 4.8 폴백(Fallback)**을 반드시 준비
「새 모델이니까 기존 프롬프트를 더 욱여 넣자」가 아니라, 「똑똑해졌으니 줄일 수 있다」는 방향으로 사고를 전환하는 것이 Fable 5를 제대로 활용하는 지름길입니다.
참고
참고
- Anthropic「Prompting Claude Fable 5」 https://platform.claude.com/docs/en/build-with-claude/prompt-engineering/prompting-claude-fable-5
- Anthropic「Introducing Claude Fable 5 and Claude Mythos 5」 https://platform.claude.com/docs/en/about-claude/models/introducing-claude-fable-5-and-claude-mythos-5
- MindStudio「How to Use Claude Fable 5 for Complex Agentic Workflows」 https://www.mindstudio.ai/blog/how-to-use-claude-fable-5-agentic-workflows
토론(Discussion)

AI 자동 생성 콘텐츠
본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기