MCP와 Skills에 이은 제3의 혁명: Claude Code Workflow가 ultrawork로 Agent를 코드에 각인시키다

Anthropic이 claude-code@v2.1.47의 ChangeLog에 몰래 추가했다가 직후에 삭제한 기능이 있다.

ChangeLog에서는 사라졌음에도 불구하고, 코드 본체에서는 삭제되지 않았다. 현재도 동작한다. 그리고 Anthropic 공식 문서에도 아직 단 한 줄도 기재되어 있지 않다——.

그것이 바로, Workflow(워크플로우) 기능이다.

MCP(Model Context Protocol)가 "AI에게 손발을 주었다", Skills가 "AI에게 작업 절차서를 주었다"라고 한다면, Workflow는 "AI의 팀워크를 고정 코드로 결정화(Crystallize)시킨다"는 기능이다. 이는 MCP 이후 최대의 파괴적 혁신이 될 것이다.

이 기사에서는 Workflow의 활성화 방법, 실전 시연, 타 기능과의 차이점, 그리고 6가지 형태를 도해와 함께 완전 해설한다.

항목	내용
대응 버전	`claude-code@v2.1.47` / `v2.1.48` 이후
활성화 방법	`export CLAUDE_CODE_WORKFLOWS=1`
호출 키워드	`ultrawork` (입력 후 채색 그라데이션 표시)
기술 언어	JavaScript (자동 생성 또는 수동 작성)
스크립트 저장 기간	기본 3일 (사용자 경로로 이동 시 영속화)
공식 문서	미게재 (2025년 5월 현재)
경쟁 개념	MCP, Skills, Subagent, Agent Teams

방법은 허탈할 정도로 심플하다.

# Step 1: 환경 변수를 명시적으로 활성화
export CLAUDE_CODE_WORKFLOWS=1
# Step 2: Claude Code를 기동
...

기동 후, 프롬프트에 ultrawork라고 입력하면 해당 키워드가 채색 그라데이션으로 변화한다. 이것이 Workflow 기능이 활성화되어 있다는 시각적인 증거다.

export는 현재 세션에만 적용된다. 영속화하고 싶다면 ~/.bashrc 또는 ~/.zshrc에 추가해 두는 것이 좋다.

ultrawork 현재 PR에 대해 multi-agent의 review workflow를 생성하여 실행해 주세요

Claude Code는 다음과 같은 시퀀스를 자동 실행한다:

설계 단계: Workflow의 전체 설계를 선언 ("3단계 리뷰 Workflow를 구축합니다")
컨텍스트 생성: context.md를 프로젝트 경로에 자동 생성
스크립트 자동 작성: 300행 이상의 JavaScript 코드를 자동 기술
병렬 실행 시작: 여러 명의 전문 리뷰어 Agent가 동시에 기동

// Workflow 스크립트 구조 (자동 생성 예시)
export default {
name: "PR Multi-Agent Review",
...

Ctrl + O로 스크립트를 전개하여 실시간으로 내용을 확인할 수 있다.

/workflows

이 명령어를 통해 실행 중인 모든 Agent의 상태, 처리 시간, 소비 Token, 호출한 도구 목록을 실시간으로 확인할 수 있다. 이것이 Workflow의 가장 큰 강점 중 하나—— 블랙박스가 되지 않는 투명성이다.

Workflow 등장 이전부터 존재하는 유사 기능과의 차이점을 정리해 둔다.

기능	기동 방법	재사용성	추적성	고정화
Subagent	자연어로 즉시	❌ 일회성	❌ 없음	❌ 없음
Agent Teams	자연어 + 인간 주도	△ 제한적	△ 수동	❌ 없음
Skills	모델이 자동 발견	✅ 높음	❌ 없음	△ Prompt 고정
Workflow	`ultrawork` 명시 지정	✅ 매우 높음	✅ `/workflows`	✅ JS 스크립트

Subagent는 "주 Agent가 서브 Agent를 일시적으로 파생시키는" 메커니즘이다. 자연어 한 줄로 기동할 수 있지만, 동일한 처리를 재현할 수 없다. 매번 미묘하게 다른 동작이 된다.

# Subagent (재현성 없음)
이 파일을 리뷰해줘 → Agent 기동 → 결과 반환 → 종료 (유실됨)

Workflow는 「흐름을 JavaScript 코드로 고정」한다. 다른 팀 멤버가 스크립트를 복사하는 것만으로, 완전히 동일한 정밀도의 처리를 재현할 수 있다.

Skills는 「대형 모델(Large Model)이 문맥에 따라 자동으로 발견·자동 발화하는 베스트 프랙티스(Best Practice) 문서」다. 반면 Workflow는:

명시적 선언: ultrawork 키워드로 수동 트리거 -
구조 고정: JS 스크립트로 스테이지(Stage)·Agent 수·순서를 확정 -
품질 관리 가능: Evaluator-Optimizer 패턴으로 자동 품질 체크를 내장 가능

본질적인 차이를 한마디로 말하자면:

Skills는 「AI에게 현명한 행동을 가르치는 것」이고, Workflow는 「AI의 팀워크를 코드에 각인시키는 것」이다.

최소 구성의 Workflow 스크립트에는 다음 3가지 요소가 필요하다:

export default {
// ① 메타데이터 (name과 description은 필수)
name: "My Workflow",
...

이 3가지 요소를 충족하면 아무리 복잡한 처리도 구조화할 수 있다.

Workflow가 대응하는 6가지 패턴을 각각의 유스케이스(Use Case)와 함께 해설한다.

가장 기본적인 형태. 전 단계의 출력이 다음 단계의 입력이 되는 직렬 처리다. 각 Agent가 전문성을 가지고 바통을 넘겨간다.

적합한 유스케이스: 코드 리뷰 → 취약점 검사 → 리포트 생성 -
특징: 심플하고 예측 가능하며, 디버깅이 용이함 -
주의점: 어느 한 스테이지에서 막히면 전체가 중단됨

Orchestrator가 여러 Worker Agent에게 태스크를 동시에 분산하고, 전체 완료 후에 결과를 집약하는 형태.

적합한 유스케이스: 코드 리뷰 + 보안 검사 + 성능 분석을 동시에 실행 -
특징: 처리 시간이 대폭 단축됨 (직렬의 1/N 정도) -
주의점: 집약(Aggregation) 로직이 복잡해지기 쉬움

**생성 Agent와 Evaluator Agent가 대치하며, 품질 기준을 만족할 때까지 루프(Loop)**하는 형태. GAN(적대적 생성 신경망)의 발상을 Workflow에 도입한 것이다.

적합한 유스케이스: 테스트를 통과할 때까지 코드를 자동 수정, 품질 기준을 만족할 때까지 문서를 다시 작성 -
특징: 사람의 개입 없이 자동으로 품질을 끌어올림 -
주의점: 무한 루프를 방지하기 위한 최대 반복 횟수 설정이 중요

Router가 입력(Input)의 종류를 판단하여 최적의 전문 Agent로 배분하는 형태.

적합한 유스케이스: 버그 보고 → Bug Fix Agent, 기능 추가 요청 → Feature Agent, 문서 요청 → Docs Agent -
특징: 전문성의 극대화, 범용 Agent보다 고품질의 출력 -
주의점: 분류 정밀도가 시스템 전체의 품질과 직결됨

Orchestrator가 전체 계획을 수립하고, 동적으로 Worker를 할당하면서 결과를 축적해 나가는 형태.

적합한 유스케이스: 대규모 리포지토리(Repository) 리팩토링, 여러 파일에 걸친 버그 수정 -
특징: Orchestrator가 진행 상황에 따라 플랜을 조정할 수 있는 유연성 -
주의점: Orchestrator 자체의 판단 품질이 전체를 좌우함

Workflow가 Workflow를 호출하는 재귀적인 구조. 큰 문제를 작은 Workflow로 분해하며, 각각이 독자적인 Agent 군을 가진다.

적합한 유스케이스: 딥 리서치 ([검색 WF] + [검증 WF] + [합성 WF] → 최종 리포트) -
특징: 극도로 복잡한 태스크를 정리된 구조로 처리할 수 있음 -
주의점: 깊이가 깊어질수록 디버깅이 어려워짐. 계층은 3층 이내를 권장

Workflow가 특히 힘을 발휘하는 장면을 정리한다.

장면	권장 패턴	효과
다차원 코드 리뷰	Parallel + Pipeline	여러 관점을 동시에, 단계적으로 심화
...

Workflow 스크립트의 기본 저장 기간은 3일이다. 유효 기간이 지나면 자동으로 삭제된다.

운영 환경에서 지속적으로 사용하고 싶다면, 사용자 레벨의 경로로 이동한다:

# Claude Code에 자연어로 지시하기만 하면 OK
이 Workflow 스크립트를 사용자 경로로 복사하여 영구 저장해줘

영구 저장된 스크립트는:

다음 회차부터도 직접 호출 가능
팀원에게 복사하여 전달함으로써
완전히 동일한 Workflow를 재현 가능 - GitHub에 커밋하여 오픈 소스화할 수 있음

이것이 향후 "GitHub 상에 수만 개의 Workflow 오픈 소스 프로젝트가 나타날 것"이라고 예측하는 이유다.

Workflow는 "자연어 프롬프트로 기술해 온 AI에 대한 지시"를, 재현 가능(Reproducible)·추적 가능(Traceable)·품질 관리 가능(Manageable)한 JavaScript 코드로서 승화시키는 기능이다.

MCP가 "AI가 무엇을 할 수 있는지"를 정의하고 -
Skills가 "AI에게 어떻게 하는지를 가르치며" -
Workflow가 "AI의 팀워크를 코드로 고정한다"

이 세 가지가 갖춰져야 비로소 진정한 의미의 Harness Engineering——AI의 잠재력을 제어(Control)·재현(Reproduce)·최대화(Maximize)하는 엔지니어링——이 실현된다.

Anthropic이 공식 문서 게재를 준비하고 있다면, 그것은 Workflow가 아직 "숙성 중"이기 때문일지도 모른다. 그렇기에 지금이 가장 빠르게 습득할 수 있는 절호의 타이밍이다.

당신의 팀이 현재 가장 반복하고 있는 "AI 작업"은 무엇인가? 그것이 Workflow화의 첫 번째 후보가 될 것이다. 꼭 댓글로 알려달라.

Insights

MCP와 Skills에 이은 제3의 혁명: Claude Code Workflow가 ultrawork로 Agent를 코드에 각인시키다

요약

핵심 포인트

댓글

현대적 개발자 워크플로에서 CISA 위협 인텔리전스를 운영화하기

RRF를 도해로 배우자! - Reciprocal Rank Fusion을 초등학교 3학년도 이해할 수 있게 설명할게

자연어 SQL에는 유효한 SQL뿐만 아니라 메트릭 계약 테스트 (Metric Contract Tests)가 필요합니다

홍해 유조선 운송 지속에 유가 하락세로 전환

현대적 개발자 워크플로에서 CISA 위협 인텔리전스를 운영화하기

RRF를 도해로 배우자! - Reciprocal Rank Fusion을 초등학교 3학년도 이해할 수 있게 설명할게

자연어 SQL에는 유효한 SQL뿐만 아니라 메트릭 계약 테스트 (Metric Contract Tests)가 필요합니다

홍해 유조선 운송 지속에 유가 하락세로 전환