모든 작업을 위한 하니스: Claude Code의 다이내믹 워크플로 (Dynamic Workflows)

Claude Code의 Dynamic Workflows 소개

Anthropic의 Claude Code 팀(Thariq Shihipar, Sid Bidasaria)이 공개한 글로, Claude Code에 새롭게 도입된 다이내믹 워크플로(Dynamic Workflows) 기능에 대한 설명입니다. 다이내믹 워크플로는 Claude가 작업에 맞춰 즉석에서 자체적인 실행 구조(하니스, harness)를 JavaScript 파일 형태로 직접 작성해 여러 서브에이전트(sub-agents)를 조율하는 방식입니다. 기존 Claude Code의 기본 하니스는 코딩 작업에 최적화되어 있지만, 장시간·대규모 병렬·적대적 검증이 필요한 작업에서는 한계가 있었고, 이를 해결하기 위해 Claude 스스로 맞춤형 하니스를 만들도록 한 것이 핵심입니다.

도입 배경과 작동 방식

단일 컨텍스트의 한계: 하나의 컨텍스트 창에서 계획과 실행을 동시에 진행할 때 발생하는 세 가지 실패 모드가 존재합니다. 작업을 절반쯤 하고 끝났다고 선언하는 에이전틱 게으름(agentic laziness), 자신의 결과물을 우호적으로 평가하는 자기 선호 편향(self-preferential bias), 컨텍스트 압축 과정에서 원래 목표가 흐려지는 목표 표류(goal drift)가 그것입니다.

작동 구조: JavaScript 파일을 실행해 서브에이전트(sub-agents)를 생성·조율하며, JSON·Math·Array 등 표준 함수를 활용할 수 있습니다. 각 서브에이전트의 모델 종류(Sonnet, Opus 등)와 워크트리(worktree) 격리 여부도 워크플로가 직접 결정합니다. 중단 시 세션 재개로 이어서 실행이 가능합니다.

호출 방법: Claude에게 워크플로를 만들라고 요청하거나 트리거 단어 "ultracode"를 사용하면 됩니다.

대표 패턴(Patterns) 정리

분류 후 라우팅(Classify and Route): 분류기 에이전트가 작업 유형을 판별한 뒤, 유형에 맞는 에이전트나 처리 흐름으로 분기시키는 방식입니다. 마지막 단계에서 결과 분류용으로 쓰기도 합니다.

팬아웃과 합성(Fan-out and Synthesize): 큰 작업을 작은 단위로 쪼개 각 단위마다 별도 에이전트를 돌린 뒤, 합성(synthesize) 단계에서 모든 결과를 모아 하나로 병합합니다. 깨끗한 컨텍스트가 필요한 다수의 소단위 작업에 적합합니다.

적대적 검증(Adversarial Verification): 각 작업 에이전트마다 별도의 검증 에이전트를 붙여 루브릭(rubric, 평가 기준표)에 따라 결과를 반박·검증하게 합니다.

생성 후 필터링(Generate and Filter): 다수의 아이디어를 생성한 뒤 루브릭과 검증으로 거르고 중복을 제거해 최고 품질의 후보만 남깁니다.

토너먼트(Tournament): 동일 작업을 서로 다른 접근법으로 N개 에이전트가 경쟁 수행하고, 심판 에이전트가 쌍대 비교(pairwise comparison)로 우승자를 가립니다. 쌍대 비교는 절대 점수 평가보다 신뢰도가 높다고 설명합니다.

수렴까지 반복(Loop Until Convergence): 작업량이 미리 정해지지 않은 경우, 새로운 발견이나 오류가 더 이상 없을 때까지 에이전트 생성을 반복합니다.

활용 사례(Use Cases) 정리

대규모 리팩토링과 마이그레이션 (Refactoring and Migration): 콜사이트(Call sites), 실패하는 테스트, 모듈 단위로 쪼개어 워크트리(Worktree)마다 서브에이전트(Sub-agent)가 수정하고, 또 다른 에이전트가 적대적으로 리뷰(Review)한 후 병합합니다. 실제로 Zig에서 Rust로의 재작성 사례가 있으며, 리소스 집약적 명령을 피하도록 지시하면 병렬성(Parallelism)을 극대화할 수 있습니다.

딥 리서치 (/deep-research 스킬): 웹 검색을 팬아웃(Fan-out)하여 소스를 수집하고, 적대적 검증(Adversarial verification)으로 주장을 확인한 뒤 인용이 달린 보고서로 합성합니다. 슬랙(Slack)에서 상태 보고서 작성, 코드베이스 심층 탐색 등에도 응용 가능합니다.

사실 확인 (Fact-Checking): 보고서 안의 모든 사실 주장을 식별하는 에이전트가 먼저 실행되고, 각 주장마다 검증 서브에이전트가 출처를 확인하며, 별도의 검증 에이전트가 출처 품질까지 평가합니다.

정성적 정렬과 랭킹 (Qualitative Alignment and Ranking): 1,000행 이상의 지원 티켓을 심각도순으로 정렬하는 것처럼 한 번에 처리하기 어려운 작업을, 토너먼트형 쌍대 비교(Tournament-style pairwise comparison) 파이프라인이나 버킷 분할 병렬 처리 후 병합하는 방식으로 해결합니다.

규칙 검증과 CLAUDE.md 자동화: 규칙별로 검증 에이전트를 두어 누락을 잡고, 회의주의자 페르소나(Skeptic persona) 에이전트가 규칙 자체의 타당성을 검토합니다. 반대로 최근 세션과 코드 리뷰에서 반복되는 수정사항을 클러스터링(Clustering)하여 새로운 규칙을 자동 도출하기도 합니다.

간헐적 실패 디버깅과 사후 분석 (Post-mortem): 로그·파일·데이터별로 독립된 에이전트가 서로 분리된 증거로부터 가설을 세우고, 검증자·반박자 패널이 각 가설을 평가합니다. 코드뿐 아니라 매출 하락 원인 분석, 데이터 파이프라인 장애 분석 등에도 적용됩니다.

트리아지(Triage)와 백로그 처리: 지원 큐(Queue)·버그 리포트를 분류하고 기존 항목과 중복을 제거한 후 자동 수정하거나 사람에게 에스컬레이션(Escalation)합니다. 신뢰할 수 없는 외부 콘텐츠를 읽는 에이전트와 권한 있는 행동을 수행하는 에이전트를 분리하는 격리(Quarantine) 패턴이 권장됩니다. /loop와 조합하면 상시 운영이 가능합니다.

창의적 탐색과 평가 (Eval): 디자인·네이밍처럼 취향이 개입되는 작업에서 다수의 안을 만든 뒤, 리뷰 에이전트가 루브릭(Rubric)으로 채점 및 선별합니다. 스킬 자체의 품질을 채점하고 개선하는 가벼운 평가에도 활용 가능합니다.

모델 라우팅 (Model Routing): 분류기(Classifier) 에이전트가 작업 복잡도를 사전 조사한 뒤 Sonnet과 Opus 중 적절한 모델을 선택하여 라우팅합니다.

장점과 차별점

차별점: 기존 Claude Agent SDK나 claude -p로 만드는 정적(Static) 워크플로는 일반화된 처리를 위해 범용적으로 작성되어야 하지만, 다이내믹 워크플로는 Claude가 그때그때 맞춤형 하니스(Harness)를 즉석에서 작성한다는 점이 다릅니다.

장점: 컨텍스트(Context)를 분리한 다수의 에이전트가 각자의 목표에 집중하므로 게으름(Laziness)·자기 선호(Self-preference)·목표 표류(Goal drift) 문제를 구조적으로 줄일 수 있습니다. 중단된 세션 재개, 토큰 예산 지정(예: "use 10k tokens"), /goal·/loop와의 결합, "s" 키로 저장 후 ~/.claude/workflows 디렉터리나 스킬을 통한 공유까지 운영 측면의 기능이 갖춰져 있습니다.

단점과 주의점: 토큰 사용량이 크게 늘어날 수 있어 모든 작업에 적합하지는 않습니다. 일반적인 코딩 작업에는 다섯 명의 리뷰어 패널이 필요 없다는 점을 저자도 분명히 짚고 있으며, "정말 더 많은 연산이 필요한가"를 스스로 묻고 사용할 것을 권합니다. 모범 사례(Best practices)도 아직 형성 중인 단계입니다.

다이내믹 워크플로는 Claude Code를 단일 코딩 도우미에서 다수 에이전트를 조율하는 메타 오케스트레이터(Meta-orchestrator)로 확장하는 변화로 읽힙니다. 정적 파이프라인과 자율 에이전트 사이의 중간 지점을 노린 접근으로, 코드 마이그레이션·딥 리서치·트리아지·사후 분석 같은 장시간 구조적 작업에서 효과가 두드러질 것으로 보입니다. 다만 토큰 비용이 크고 모범 사례가 정립되지 않은 만큼, 패턴별 적합성을 신중히 따져 "퀵 워크플로"부터 작게

Insights

모든 작업을 위한 하니스: Claude Code의 다이내믹 워크플로 (Dynamic Workflows)

요약

핵심 포인트

Claude Code의 Dynamic Workflows 소개

장점과 차별점

댓글

가드레일은 프롬프트 문구가 아니라 코드입니다

2026년 데이터가 사장시킨 12가지 비즈니스 아이디어

Open-weight AI는 Kubernetes의 순간을 맞이하고 있습니다. 이를 망치지 맙시다

inclusionAI (Ant Group)가 124B sparse MoE (활성 파라미터 5.1B), 256K 컨텍스트를 갖춘

가드레일은 프롬프트 문구가 아니라 코드입니다

2026년 데이터가 사장시킨 12가지 비즈니스 아이디어

Open-weight AI는 Kubernetes의 순간을 맞이하고 있습니다. 이를 망치지 맙시다

inclusionAI (Ant Group)가 124B sparse MoE (활성 파라미터 5.1B), 256K 컨텍스트를 갖춘