오늘 Fable로 엄청난 양의 작업을 처리하면서도 속도 제한(rate limits)에 걸리지 않았습니다. 제가 어떻게 하고 있는지 몇 가지

오늘 Fable로 엄청난 양의 작업을 처리하면서도 속도 제한 (rate limits)에 걸리지 않았습니다. 제가 어떻게 하고 있는지 몇 가지 팁을 공유하고 싶습니다.

저는 현재 Fable을 "high" effort 모드로만 사용합니다. xhigh는 토큰 소모가 심합니다. max/extra 모드는 제 생각에 출력 품질도 낮은 옵션들보다 떨어지면서 에너지만 엄청나게 잡아먹는 용광로 같습니다.
저는 Claude Code에게 많은 구현 작업 시 폴백 (fallback) 용도로 Codex를 사용하는 법을 가르쳤습니다. GPT-5.5는 조종 가능성 (steerable)이 믿기지 않을 정도로 뛰어나며, Fable은 이를 조종하는 법을 배울 수 있습니다.
워크플로 (workflows)와 하위 에이전트 (subagents)를 오케스트레이션 (orchestrating)할 때, 다양한 작업에 맞춰 서로 다른 모델들의 우선순위를 정하는 방법에 대해 제 CLAUDE[.]md 파일에 큰 섹션을 작성해 두었습니다.
불필요하게 토큰을 많이 사용하는 작업들 (컴퓨터 사용 (computer use), 코드베이스 분석 (codebase analysis) 등)은 다른 모델로 수행한 뒤 그 결과를 Fable에 보고합니다.

Insights