Claude Code를 위한 자율 소프트웨어 개발 도구, ForgeDock
요약
ForgeDock은 Claude Code 환경 내에서 이슈 조사부터 머지까지 소프트웨어 개발 전 과정을 자율적으로 수행하는 도구입니다. 발견된 버그와 수정 사항을 구조화된 컨텍스트로 저장하여 에이전트의 학습 효과를 극대화합니다.
핵심 포인트
- 이슈 조사, 설계, 빌드, 리뷰, 머지 등 전체 라이프사이클 자동화
- 9개의 전문 리뷰 에이전트를 통한 도메인별 심층 검토
- 구조화된 컨텍스트를 활용한 지속적인 에이전트 메모리 구축
- 별도의 런타임 없이 Claude Code 내 프롬프트 명령으로 실행
Claude Code를 위한 자율 소프트웨어 개발 (Autonomous software development).
ForgeDock은 발견된 모든 버그, 배포된 모든 수정 사항, 그리고 모든 리뷰 결과물을 다음 에이전트(agent)를 더 똑똑하게 만드는 구조화된 컨텍스트(structured context)로 전환합니다. 이 도구는 코드 리뷰가 찾아낼 수 없는 통합 버그(integration bugs)를 잡아냅니다. 예를 들어, 누락된 라우트 등록(route registrations), CI에는 존재하지만 배포(deploy) 시에는 없는 환경 변수(env vars), Docker 권한 불일치(permission mismatches), 수정되지 않은 인접 코드 경로(sibling code paths) 등이 이에 해당합니다. 모든 발견 사항은 향후 빌드를 위한 방지 규칙(prevention rule)으로 피드백됩니다. 프로덕션 코드베이스(production codebases)에서 수천 개의 이슈를 처리한 결과, 이 시스템은 버그가 테스트 브랜치(testing branch)에 도달하기 전에 이를 잡아냅니다.

15개 이상의 이슈가 병렬로 조율됨 — 조사, 빌드, 리뷰 및 배포가 자율적으로 수행됩니다.
ForgeDock은 Claude Code 내부에서 이슈의 전체 라이프사이클(lifecycle) — 조사(investigate), 설계(architect), 빌드(build), 품질 게이트(quality-gate), 리뷰(review), 그리고 머지(merge) — 를 자율적으로 실행합니다. 사용자는 이슈를 오픈하고, /work-on #42를 실행한 뒤, 머지(merge)를 클릭하기만 하면 됩니다. 모든 단계는 구조화된 컨텍스트를 GitHub에 다시 기록하므로, 다음 에이전트는 눈먼 상태가 아닌 스마트한 상태로 시작할 수 있습니다.
사용자: /work-on #42
ForgeDock: 조사(Investigate) → 설계(Architect) → 빌드(Build) → 품질 게이트(Quality Gate) → 리뷰(Review) → PR 오픈(open PR)
사용자: 머지(merge) 클릭
새로운 런타임(runtime), 별도의 프로세스, 클라우드 서비스가 필요하지 않습니다. 여러분이 이미 사용 중인 Claude Code 내부에서 실행되는 프롬프트 엔지니어링된 명령 사양(prompt-engineered command specs)일 뿐입니다.
| 기능 (Capability) | 작동 방식 (How it works) |
|---|---|
| 전체 수명 주기 자동화 (Full-lifecycle automation) | /work-on #42 — 이슈를 조사하고, 수정 사항을 설계하며, 빌드하고, 품질 게이트 (quality gates)를 실행하고, PR (Pull Request)을 생성한 뒤 리뷰합니다. 사용자는 머지 (merge)만 클릭하면 됩니다. |
| 지속적인 에이전트 메모리 (Persistent agent memory) | GitHub 이슈/PR에 작성된 구조화된 FORGE: 주석은 컨텍스트 리셋 (context resets)과 세션 경계를 유지합니다. 에이전트는 결코 아무 정보 없이 시작하지 않습니다. |
| 9개의 전문 리뷰 에이전트 (9 specialist review agents) | 보안, 결제, 데이터베이스, 동시성, 인증, 프론트엔드, API, 성능, 인프라 — 모든 PR은 도메인 전문가의 리뷰를 받습니다. |
| 복리로 쌓이는 조직적 메모리 (Institutional memory that compounds) | 이슈 #43을 수정하는 에이전트는 #42의 조사 내용을 읽고 알려진 패턴을 적용합니다 — 재조사가 필요 없습니다. |
| 자기 개선 파이프라인 (Self-improving pipeline) | 리뷰 에이전트는 과거의 발견 사항으로부터 학습합니다 — 반복되는 패턴은 자동으로 새로운 품질 게이트 체크 항목이 됩니다. |
| 병렬 오케스트레이션 (Parallel orchestration) | /orchestrate는 마일스톤 (milestones)을 여러 단계 (waves)로 분해하고 각 단계에 대해 /work-on을 병렬로 실행합니다. |
비용 참고: ForgeDock 자체는 무료이며 오픈 소스입니다. ForgeDock은 Claude Code 세션을 오케스트레이션하므로, 평소와 동일한 Anthropic API 사용 요금을 지불하게 됩니다. 간단한 버그에 대한 전형적인 /work-on 실행은 15~20분간의 수동 Claude Code 세션과 거의 동일한 양의 토큰을 사용합니다.
이슈 (Issue) → 조사 (Investigate) → 설계 (Architect) → 빌드 (Build) → 품질 게이트 (Quality Gate) → 리뷰 (Review) → 머지 (Merge)
↓ ↓ ↓ ↓ ↓
쓰기 (writes to) ← 읽기 (reads from) ← 읽기 (reads from) ← 읽기 (reads from) ← 쓰기 (writes to)
...
각 단계는 GitHub 이슈 또는 PR에 구조화된 주석 (<!-- FORGE:INVESTIGATOR -->, <!-- FORGE:CONTRACT --> 등)을 작성합니다. 각 후속 단계는 이전 단계의 내용을 읽습니다. gh CLI는 쿼리 인터페이스 역할을 합니다.
| 단계 | 역할 |
|---|---|
| 조사 (Investigate) | git blame, 관련 이슈/PR을 통해 근본 원인을 추적합니다. 판결, 영향받는 파일, 심각도를 작성합니다. |
| 컨텍스트 (Context) | 동일한 모듈에서 발생했던 과거의 버그와 알려진 함정(pitfalls)을 드러냅니다. 조직적 기억 (Institutional memory) 역할을 합니다. |
| 설계 (Architect) | 정확한 파일/함수/라인 대상을 포함한 순차적인 구현 계획을 생성합니다. |
| 빌드 (Build) | 코드를 작성하고, 브랜치를 생성하며, 커밋을 수행합니다. 설계자의 계획을 따릅니다. |
| 품질 게이트 (Quality Gate) | 14개 이상의 도메인 특화 체크 항목 (보안, 인증, DB, 동시성 등)을 수행합니다. |
| 리뷰 (Review) | 9명의 전문가 에이전트가 신뢰도 점수가 부여된 결과와 함께 PR diff를 리뷰합니다. |
| 종료 (Close) | 전체 감사 추적(audit trail)을 FORGE:TRAJECTORY로 기록합니다. |
레이블(Labels)은 워크플로우 상태(workflow:investigating, workflow:building, workflow:in-review, workflow:merged)를 추적합니다. 파이프라인은 GitHub이 나타내는 상태가 무엇이든 그 지점부터 재개되도록 설계되어 재시작에 안전(restart-safe)합니다.
요구 사항: Node.js 18+, Claude Code, GitHub CLI (gh), yq (forge.yaml을 읽기 위해 파이프라인 명령에서 사용하는 YAML 파서), 그리고 Playwright MCP (/qa-sweep 및 시각적 테스트 명령을 위한 브라우저 자동화 도구)
Playwright MCP는 브라우저 자동화 명령을 위한 ForgeDock의 필수 의존성입니다. ForgeDock을 설치한 후 Claude Code에 이를 등록하세요: claude mcp add playwright npx @playwright/mcp@latest. npx forgedock doctor로 확인하세요 — Check 9에서 Playwright MCP가 등록되었는지 확인합니다.
# 파이프라인 명령 설치
npx forgedock
# 리포지토리용 설정 생성
...
이 명령은 25개 이상의 파이프라인 명령을 ~/.claude/commands/에 심볼릭 링크(symlinks)로 연결하고, 프로젝트 루트에 forge.yaml 설정을 생성합니다. npx forgedock doctor는 설치 상태 점검(health check)을 실행합니다 — 명령 심볼릭 링크, forge.yaml, 필수 도구 (gh, yq, Claude Code), GitHub 워크플로우 레이블, 그리고 Playwright MCP를 확인하며, 각 항목에 대해 수정 힌트와 함께 명확한 pass/fail/warn 라인을 출력하고, 문제가 있을 경우 0이 아닌 값으로 종료합니다. 설정이 제대로 되지 않은 것 같을 때 언제든 실행하세요. 이제 끝났습니다 — Claude Code를 열고 /work-on #42를 실행하세요.
위험 부담 없이 시도해 보세요: 5분 내외의 시작하기 (Getting Started) 가이드를 따라 첫 번째 파이프라인을 설치, 설정 및 엔드투엔드 (end-to-end)로 실행해 보세요. 명령어가 생소하신가요? 명령어 참조 (Command Reference)를 통해 각 명령어가 수행하는 역할에 대한 안내를 받아보세요.
기타 설치 방법 및 명령어
Claude Code 플러그인 마켓플레이스 (Plugin Marketplace) (v2.1.143+):
/plugin marketplace add RapierCraftStudios/ForgeDock
/plugin install forgedock@forgedock
CLI 명령어:
npx forgedock update # 최신 명령어 가져오기
npx forgedock uninstall # ~/.claude/commands/에서 모든 ForgeDock 명령어 제거
npx forgedock help # 사용 가능한 모든 명령어 표시
독립형 러너 (Standalone runner) (Claude Code 외부에서 파이프라인 실행 — CI/CD, 헤드리스 배치 (headless batch)):
# 조립된 프롬프트 + 도구 계획 미리보기 (API 키 불필요)
npx forgedock run work-on 42 --dry-run
# Anthropic API를 통해 직접 헤드리스로 실행
...
forgedock run은 동일한 commands/*.md 명세 (specs)를 로드하고 Anthropic 도구 사용 (tool-use) 루프를 직접 구동하므로, 파이프라인이 더 이상 Claude Code 에이전트 루프에 의존하지 않습니다. Claude Code는 여전히 권장되는 대화형 경험이며, 러너는 CI/CD 및 비(non)-Claude-Code 경로를 추가해 줍니다. 플래그 (Flags): --dry-run, --model <id>, --max-iterations <n>.
AI 기반 설정 (AI-powered setup) (Claude Code 내부):
/forgedock-init # 가이드 기반 설정 워크스루 — 저장소를 스캔하고, GitHub에 질의하며, forge.yaml을 자동 완성합니다.
실제 파이프라인 실행 사례 보기
이슈 #619에서 실제로 실행된 모습은 다음과 같습니다. 이는 명령어 명세가 컨텍스트 (context)에서 약 200K 토큰을 소모하던 성능 버그에 관한 내용입니다:
FORGE:INVESTIGATOR → CONFIRMED. 세션 시작 시 심볼릭 링크 (symlinks)를 통해 27개의 모든 명령어 명세 파일 (848KB)이 컨텍스트에 로드됨. ~200K 토큰 낭비.
FORGE:CONTRACT → 심볼릭 링크 기반 설치를 스텁 파일 (stub-file) 패턴으로 교체.
...
컨텍스트 단계에서 동일한 모듈 내의 두 가지 과거 버그(#577, #587)를 발견하여, 빌더가 이미 알려진 실수를 반복하는 것을 방지했습니다. 전체 이슈 보기 →
ForgeDock은 25개 이상의 명령어를 설치하지만, 시작하는 데는 단 세 가지만 있으면 됩니다. 이 명령어들은 이슈(issue)부터 머지(merge)까지의 전체 루프를 다룹니다:
| 명령어 | 기능 |
|---|---|
/issue | 원하는 내용을 설명하면 파이프라인(pipeline) 준비가 된 이슈를 생성합니다 |
/work-on #N | 조사, 빌드, 리뷰 및 머지를 자동으로 수행합니다 |
/review-pr | 도메인 전문가 에이전트(domain-specialist agents)가 PR을 리뷰합니다 |
그 외의 모든 것은 추가적인 기능입니다. 워크플로우가 확장됨에 따라 명령어를 추가하세요: 작업을 병렬로 실행할 때 사용하는 팀 워크플로우 (Team Workflows) (/orchestrate, /milestone), 운영 환경(production)에서 필요할 때 사용하는 운영 (Operations) (/rollback, /incident-response), 그리고 작업이 일상화되었을 때 사용하는 파이프라인 튜닝 (Pipeline Tuning) (/autopilot, /pipeline-health) 등이 있습니다. 전체 단계별 가이드는 명령어 학습 경로(Command Learning Path)를 참조하세요.
| 명령어 | 기능 |
|---|---|
/work-on #N | 전체 이슈 라이프사이클: 조사 → 빌드 → 리뷰 → 머지 |
/issue | 파이프라인 준비가 된 GitHub 이슈 생성 |
/orchestrate | 마일스톤(milestone)의 이슈들에 대한 병렬 실행 |
/review-pr | 9개의 도메인 전문가 에이전트를 통한 PR 리뷰 |
/quality-gate | 14개 이상의 도메인에 걸친 프리 커밋(pre-commit) 체크 |
/milestone | 마일스톤 계획 및 배포 |
/deploy-info | 리스크 평가를 포함한 스테이징(Staging) 대 메인(main) 차이점 분석 |
/review-pr-staging | 스테이징에서 메인으로의 리뷰 게이트(review gate) |
/rollback | 운영 사고 발생 시 자동화된 리버트(revert) PR 생성 |
/incident-response | P0 조정: 핫픽스(hotfix), 타임라인, 사후 분석(postmortem) |
/autopilot | 자율적 개선: 재조사(recon) → 분류(triage) → 수정(fix) |
/pipeline-health | 자체 분석 및 프롬프트 튜닝 (prompt tuning) |
/security-audit | 4단계 보안 태세 감사 (security posture audit) |
/qa-sweep | 브라우저 자동화를 통한 전체 플랫폼 QA |
/analytics | GSC, Clarity, Umami, Stripe에서 메트릭(metrics) 추출 |
/cleanup | 오래된 이슈, 브랜치, 워크트리(worktrees) 정리 |
ForgeDock은 글로벌 (global) ~/.claude/commands/ 네임스페이스(namespace)를 소유합니다. npx forgedock이 실행되면, 모든 파이프라인 명령어를 해당 위치에 심볼릭 링크(symlink)로 연결하고, 다른 설치 프로그램들이 소유자를 감지할 수 있도록 .symlink-source 센티넬(sentinel) 파일을 작성합니다:
~/.claude/commands/
.symlink-source ← sentinel: "ForgeDock owns this namespace"
work-on.md → /path/to/forgedock/commands/work-on.md
...
**프로젝트별 명령 (Project-specific commands)**은 대신 프로젝트 로컬 (project-local) .claude/commands/ 디렉토리에 설치되어야 합니다:
your-project/
.claude/
commands/
...
Claude Code는 글로벌 (~/.claude/commands/) 명령과 프로젝트 로컬 (.claude/commands/) 명령을 자동으로 병합합니다. 이름 충돌이 발생할 경우 프로젝트 로컬 명령이 우선권을 갖습니다.
만약 다른 도구가 ~/.claude/commands/를 대상으로 하는 자체 설치 스크립트를 실행하면, ForgeDock의 심볼릭 링크 (symlinks)를 해당 도구의 소스 경로로 조용히 재지정하여 전역적으로 모든 ForgeDock 명령을 깨뜨리게 됩니다. .symlink-source 센티넬 (sentinel)은 다른 설치 프로그램들을 위한 기계 판독 가능한 경고이며, ForgeDock 또한 npx forgedock install 실행 중 충돌이 감지되면 명령별 경고를 발생시킵니다.
AI 코딩 에이전트 (AI coding agents)는 세션 사이의 모든 것을 잊어버립니다. 이들은 동일한 버그를 다시 조사하고, 과거 PR (Pull Requests)의 컨텍스트를 놓치며, 지난주에 이미 발견되어 수정된 실수를 반복합니다. 조직적 기억 (institutional memory)이 존재하지 않는 것입니다.
ForgeDock은 GitHub 자체를 메모리 계층 (memory layer)으로 사용함으로써 이 문제를 해결합니다. 모든 파이프라인 단계는 이슈 (issues)와 PR에 구조화된 FORGE: 어노테이션 (annotations)을 작성합니다. 모든 다운스트림 에이전트 (downstream agent)는 이를 읽습니다. 새로운 세션이 시작될 때 — Claude의 컨텍스트 (context)가 초기화된 후라도 — 에이전트는 GitHub을 쿼리하여 마지막 에이전트가 멈춘 바로 그 지점에서 작업을 이어갑니다.
ForgeDock은 또 다른 AI 코딩 에이전트가 아닙니다. 이는 Claude Code 내부에서 실행되는 프롬프트 엔지니어링된 명령 명세 (.md 파일들)의 집합입니다. 새로운 런타임 (runtime), 별도의 프로세스, 또는 이미 사용 중인 것 이외의 벤더 종속 (vendor lock-in)이 없습니다.
| 특징 | ForgeDock | 일반 Claude Code | Cursor / Windsurf | Devin / Sweep |
|---|---|---|---|---|
| 세션 간 메모리 | GitHub 상의 구조화된 어노테이션 | CLAUDE.md + 수동 노트 | 프로젝트별 컨텍스트 | 독점적 클라우드 상태 |
| ... | 없음 | IDE 전용 | 클라우드 서비스 | |
| 코드베이스 가시성 | 모든 것이 GitHub에 유지됨 | 로컬 | 로컬 + 클라우드 동기화 | 클라우드 전용 |
vs. DeepWiki (Devin) — DeepWiki는 코드베이스로부터 읽기 전용 위키 (wiki)를 단 한 번 생성합니다. ForgeDock의 FORGE 어노테이션 (annotations)은 이슈 (issue) 실행 시마다 파이프라인 에이전트 (pipeline agents)에 의해 작성됩니다. 이는 정적인 코드의 스냅샷 (snapshot)이 아니라, 근본 원인 (root causes), 아키텍처 결정 (architectural decisions), 리뷰 결과 (review findings)를 발생하는 즉시 캡처합니다.
vs. AGENTS.md / CLAUDE.md — 이 파일들은 사용자가 직접 작성하고 유지 관리합니다. 이들은 컨벤션 (conventions)과 규칙을 캡처합니다. ForgeDock 어노테이션 (annotations)은 파이프라인 에이전트 (pipeline agents)에 의해 자동으로 작성되며 실행 이력 (execution history)을 캡처합니다 — 어떤 버그가 확인되었는지, 어떤 수정 사항이 배포되었는지, 어떤 리뷰 결과가 반복되었는지 등을 기록합니다. 두 가지를 모두 사용하세요: 컨벤션 (conventions)에는 CLAUDE.md를, 조직의 지식 (institutional memory)에는 ForgeDock을 사용하십시오.
vs. Cursor Memories — Cursor Memories는 Cursor IDE의 백엔드 (backend) 범위 내로 제한되며, Claude Code의 컨텍스트 (context) 리셋 시 유지되지 않습니다. ForgeDock 어노테이션 (annotations)은 GitHub에 존재합니다 — 어떤 에이전트, 어떤 도구, 어떤 사람이라도 이를 읽을 수 있습니다. 세션 중간에 Claude의 컨텍스트 윈도우 (context window)가 압축될 때, ForgeDock 에이전트는 GitHub을 쿼리 (query)하여 정확히 중단된 지점부터 재개합니다.
vs. Devin Knowledge Base — Devin의 지식 베이스 (KB)는 독점적이고 불투명하며 벤더 종속적 (vendor-locked)입니다. ForgeDock 컨텍스트 (context)는 일반적인 GitHub 이슈 (issue) 댓글입니다 — gh api를 통해 읽기, 편집 및 쿼리 (query)가 가능합니다.
벤더 종속 (vendor lock-in)도, 블랙박스 (black box)도 없습니다.
npx forgedock uninstall
~/.claude/commands/에서 모든 ForgeDock 명령 심볼릭 링크 (command symlinks)를 제거합니다. 사용자의 forge.yaml 설정과 GitHub 이슈 (issue) 및 PR에 작성된 모든 FORGE: 어노테이션 (annotations)은 그대로 유지됩니다.
- 위험 부담 없이 ForgeDock 체험하기 — 5개의 사전 작성된 이슈 (issue)가 포함된 작은 데모 리포지토리 (demo repo); 클론 (clone) 후,
npx forgedock,/work-on 1을 실행하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Coding Assistants의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기