Claude Code를 위한 자율 소프트웨어 개발 도구, ForgeDock

Claude Code를 위한 자율 소프트웨어 개발 (Autonomous software development).

ForgeDock은 발견된 모든 버그, 배포된 모든 수정 사항, 그리고 모든 리뷰 결과물을 다음 에이전트(agent)를 더 똑똑하게 만드는 구조화된 컨텍스트(structured context)로 전환합니다. 이 도구는 코드 리뷰가 찾아낼 수 없는 통합 버그(integration bugs)를 잡아냅니다. 예를 들어, 누락된 라우트 등록(route registrations), CI에는 존재하지만 배포(deploy) 시에는 없는 환경 변수(env vars), Docker 권한 불일치(permission mismatches), 수정되지 않은 인접 코드 경로(sibling code paths) 등이 이에 해당합니다. 모든 발견 사항은 향후 빌드를 위한 방지 규칙(prevention rule)으로 피드백됩니다. 프로덕션 코드베이스(production codebases)에서 수천 개의 이슈를 처리한 결과, 이 시스템은 버그가 테스트 브랜치(testing branch)에 도달하기 전에 이를 잡아냅니다.

ForgeDock demo — parallel orchestration across 15+ issues

15개 이상의 이슈가 병렬로 조율됨 — 조사, 빌드, 리뷰 및 배포가 자율적으로 수행됩니다.

ForgeDock은 Claude Code 내부에서 이슈의 전체 라이프사이클(lifecycle) — 조사(investigate), 설계(architect), 빌드(build), 품질 게이트(quality-gate), 리뷰(review), 그리고 머지(merge) — 를 자율적으로 실행합니다. 사용자는 이슈를 오픈하고, /work-on #42를 실행한 뒤, 머지(merge)를 클릭하기만 하면 됩니다. 모든 단계는 구조화된 컨텍스트를 GitHub에 다시 기록하므로, 다음 에이전트는 눈먼 상태가 아닌 스마트한 상태로 시작할 수 있습니다.

사용자: /work-on #42
ForgeDock: 조사(Investigate) → 설계(Architect) → 빌드(Build) → 품질 게이트(Quality Gate) → 리뷰(Review) → PR 오픈(open PR)
사용자: 머지(merge) 클릭

새로운 런타임(runtime), 별도의 프로세스, 클라우드 서비스가 필요하지 않습니다. 여러분이 이미 사용 중인 Claude Code 내부에서 실행되는 프롬프트 엔지니어링된 명령 사양(prompt-engineered command specs)일 뿐입니다.

기능 (Capability)	작동 방식 (How it works)
전체 수명 주기 자동화 (Full-lifecycle automation)	`/work-on #42` — 이슈를 조사하고, 수정 사항을 설계하며, 빌드하고, 품질 게이트 (quality gates)를 실행하고, PR (Pull Request)을 생성한 뒤 리뷰합니다. 사용자는 머지 (merge)만 클릭하면 됩니다.
지속적인 에이전트 메모리 (Persistent agent memory)	GitHub 이슈/PR에 작성된 구조화된 `FORGE:` 주석은 컨텍스트 리셋 (context resets)과 세션 경계를 유지합니다. 에이전트는 결코 아무 정보 없이 시작하지 않습니다.
9개의 전문 리뷰 에이전트 (9 specialist review agents)	보안, 결제, 데이터베이스, 동시성, 인증, 프론트엔드, API, 성능, 인프라 — 모든 PR은 도메인 전문가의 리뷰를 받습니다.
복리로 쌓이는 조직적 메모리 (Institutional memory that compounds)	이슈 #43을 수정하는 에이전트는 #42의 조사 내용을 읽고 알려진 패턴을 적용합니다 — 재조사가 필요 없습니다.
자기 개선 파이프라인 (Self-improving pipeline)	리뷰 에이전트는 과거의 발견 사항으로부터 학습합니다 — 반복되는 패턴은 자동으로 새로운 품질 게이트 체크 항목이 됩니다.
병렬 오케스트레이션 (Parallel orchestration)	`/orchestrate`는 마일스톤 (milestones)을 여러 단계 (waves)로 분해하고 각 단계에 대해 `/work-on`을 병렬로 실행합니다.

비용 참고: ForgeDock 자체는 무료이며 오픈 소스입니다. ForgeDock은 Claude Code 세션을 오케스트레이션하므로, 평소와 동일한 Anthropic API 사용 요금을 지불하게 됩니다. 간단한 버그에 대한 전형적인 /work-on 실행은 15~20분간의 수동 Claude Code 세션과 거의 동일한 양의 토큰을 사용합니다.

이슈 (Issue) → 조사 (Investigate) → 설계 (Architect) → 빌드 (Build) → 품질 게이트 (Quality Gate) → 리뷰 (Review) → 머지 (Merge)
↓ ↓ ↓ ↓ ↓
쓰기 (writes to) ← 읽기 (reads from) ← 읽기 (reads from) ← 읽기 (reads from) ← 쓰기 (writes to)
...

각 단계는 GitHub 이슈 또는 PR에 구조화된 주석 (,  등)을 작성합니다. 각 후속 단계는 이전 단계의 내용을 읽습니다. gh CLI는 쿼리 인터페이스 역할을 합니다.

단계	역할
조사 (Investigate)	`git blame`, 관련 이슈/PR을 통해 근본 원인을 추적합니다. 판결, 영향받는 파일, 심각도를 작성합니다.
컨텍스트 (Context)	동일한 모듈에서 발생했던 과거의 버그와 알려진 함정(pitfalls)을 드러냅니다. 조직적 기억 (Institutional memory) 역할을 합니다.
설계 (Architect)	정확한 파일/함수/라인 대상을 포함한 순차적인 구현 계획을 생성합니다.
빌드 (Build)	코드를 작성하고, 브랜치를 생성하며, 커밋을 수행합니다. 설계자의 계획을 따릅니다.
품질 게이트 (Quality Gate)	14개 이상의 도메인 특화 체크 항목 (보안, 인증, DB, 동시성 등)을 수행합니다.
리뷰 (Review)	9명의 전문가 에이전트가 신뢰도 점수가 부여된 결과와 함께 PR diff를 리뷰합니다.
종료 (Close)	전체 감사 추적(audit trail)을 `FORGE:TRAJECTORY`로 기록합니다.

레이블(Labels)은 워크플로우 상태(workflow:investigating, workflow:building, workflow:in-review, workflow:merged)를 추적합니다. 파이프라인은 GitHub이 나타내는 상태가 무엇이든 그 지점부터 재개되도록 설계되어 재시작에 안전(restart-safe)합니다.

요구 사항: Node.js 18+, Claude Code, GitHub CLI (gh), yq (forge.yaml을 읽기 위해 파이프라인 명령에서 사용하는 YAML 파서), 그리고 Playwright MCP (/qa-sweep 및 시각적 테스트 명령을 위한 브라우저 자동화 도구)

Playwright MCP는 브라우저 자동화 명령을 위한 ForgeDock의 필수 의존성입니다. ForgeDock을 설치한 후 Claude Code에 이를 등록하세요: claude mcp add playwright npx @playwright/mcp@latest. npx forgedock doctor로 확인하세요 — Check 9에서 Playwright MCP가 등록되었는지 확인합니다.

# 파이프라인 명령 설치
npx forgedock
# 리포지토리용 설정 생성
...

이 명령은 25개 이상의 파이프라인 명령을 ~/.claude/commands/에 심볼릭 링크(symlinks)로 연결하고, 프로젝트 루트에 forge.yaml 설정을 생성합니다. npx forgedock doctor는 설치 상태 점검(health check)을 실행합니다 — 명령 심볼릭 링크, forge.yaml, 필수 도구 (gh, yq, Claude Code), GitHub 워크플로우 레이블, 그리고 Playwright MCP를 확인하며, 각 항목에 대해 수정 힌트와 함께 명확한 pass/fail/warn 라인을 출력하고, 문제가 있을 경우 0이 아닌 값으로 종료합니다. 설정이 제대로 되지 않은 것 같을 때 언제든 실행하세요. 이제 끝났습니다 — Claude Code를 열고 /work-on #42를 실행하세요.

위험 부담 없이 시도해 보세요: 5분 내외의 시작하기 (Getting Started) 가이드를 따라 첫 번째 파이프라인을 설치, 설정 및 엔드투엔드 (end-to-end)로 실행해 보세요. 명령어가 생소하신가요? 명령어 참조 (Command Reference)를 통해 각 명령어가 수행하는 역할에 대한 안내를 받아보세요.

기타 설치 방법 및 명령어

Claude Code 플러그인 마켓플레이스 (Plugin Marketplace) (v2.1.143+):

/plugin marketplace add RapierCraftStudios/ForgeDock
/plugin install forgedock@forgedock

CLI 명령어:

npx forgedock update # 최신 명령어 가져오기
npx forgedock uninstall # ~/.claude/commands/에서 모든 ForgeDock 명령어 제거
npx forgedock help # 사용 가능한 모든 명령어 표시

독립형 러너 (Standalone runner) (Claude Code 외부에서 파이프라인 실행 — CI/CD, 헤드리스 배치 (headless batch)):

# 조립된 프롬프트 + 도구 계획 미리보기 (API 키 불필요)
npx forgedock run work-on 42 --dry-run
# Anthropic API를 통해 직접 헤드리스로 실행
...

forgedock run은 동일한 commands/*.md 명세 (specs)를 로드하고 Anthropic 도구 사용 (tool-use) 루프를 직접 구동하므로, 파이프라인이 더 이상 Claude Code 에이전트 루프에 의존하지 않습니다. Claude Code는 여전히 권장되는 대화형 경험이며, 러너는 CI/CD 및 비(non)-Claude-Code 경로를 추가해 줍니다. 플래그 (Flags): --dry-run, --model <id>, --max-iterations <n>.

AI 기반 설정 (AI-powered setup) (Claude Code 내부):

/forgedock-init # 가이드 기반 설정 워크스루 — 저장소를 스캔하고, GitHub에 질의하며, forge.yaml을 자동 완성합니다.

실제 파이프라인 실행 사례 보기

이슈 #619에서 실제로 실행된 모습은 다음과 같습니다. 이는 명령어 명세가 컨텍스트 (context)에서 약 200K 토큰을 소모하던 성능 버그에 관한 내용입니다:

FORGE:INVESTIGATOR → CONFIRMED. 세션 시작 시 심볼릭 링크 (symlinks)를 통해 27개의 모든 명령어 명세 파일 (848KB)이 컨텍스트에 로드됨. ~200K 토큰 낭비.
FORGE:CONTRACT → 심볼릭 링크 기반 설치를 스텁 파일 (stub-file) 패턴으로 교체.
...

컨텍스트 단계에서 동일한 모듈 내의 두 가지 과거 버그(#577, #587)를 발견하여, 빌더가 이미 알려진 실수를 반복하는 것을 방지했습니다. 전체 이슈 보기 →

ForgeDock은 25개 이상의 명령어를 설치하지만, 시작하는 데는 단 세 가지만 있으면 됩니다. 이 명령어들은 이슈(issue)부터 머지(merge)까지의 전체 루프를 다룹니다:

명령어	기능
`/issue`	원하는 내용을 설명하면 파이프라인(pipeline) 준비가 된 이슈를 생성합니다
`/work-on #N`	조사, 빌드, 리뷰 및 머지를 자동으로 수행합니다
`/review-pr`	도메인 전문가 에이전트(domain-specialist agents)가 PR을 리뷰합니다

그 외의 모든 것은 추가적인 기능입니다. 워크플로우가 확장됨에 따라 명령어를 추가하세요: 작업을 병렬로 실행할 때 사용하는 팀 워크플로우 (Team Workflows) (/orchestrate, /milestone), 운영 환경(production)에서 필요할 때 사용하는 운영 (Operations) (/rollback, /incident-response), 그리고 작업이 일상화되었을 때 사용하는 파이프라인 튜닝 (Pipeline Tuning) (/autopilot, /pipeline-health) 등이 있습니다. 전체 단계별 가이드는 명령어 학습 경로(Command Learning Path)를 참조하세요.

명령어	기능
`/work-on #N`	전체 이슈 라이프사이클: 조사 → 빌드 → 리뷰 → 머지
`/issue`	파이프라인 준비가 된 GitHub 이슈 생성
`/orchestrate`	마일스톤(milestone)의 이슈들에 대한 병렬 실행
`/review-pr`	9개의 도메인 전문가 에이전트를 통한 PR 리뷰
`/quality-gate`	14개 이상의 도메인에 걸친 프리 커밋(pre-commit) 체크
`/milestone`	마일스톤 계획 및 배포
`/deploy-info`	리스크 평가를 포함한 스테이징(Staging) 대 메인(main) 차이점 분석
`/review-pr-staging`	스테이징에서 메인으로의 리뷰 게이트(review gate)
`/rollback`	운영 사고 발생 시 자동화된 리버트(revert) PR 생성
`/incident-response`	P0 조정: 핫픽스(hotfix), 타임라인, 사후 분석(postmortem)
`/autopilot`	자율적 개선: 재조사(recon) → 분류(triage) → 수정(fix)
`/pipeline-health`	자체 분석 및 프롬프트 튜닝 (prompt tuning)
`/security-audit`	4단계 보안 태세 감사 (security posture audit)
`/qa-sweep`	브라우저 자동화를 통한 전체 플랫폼 QA
`/analytics`	GSC, Clarity, Umami, Stripe에서 메트릭(metrics) 추출
`/cleanup`	오래된 이슈, 브랜치, 워크트리(worktrees) 정리

ForgeDock은 글로벌 (global) ~/.claude/commands/ 네임스페이스(namespace)를 소유합니다. npx forgedock이 실행되면, 모든 파이프라인 명령어를 해당 위치에 심볼릭 링크(symlink)로 연결하고, 다른 설치 프로그램들이 소유자를 감지할 수 있도록 .symlink-source 센티넬(sentinel) 파일을 작성합니다:

~/.claude/commands/
.symlink-source ← sentinel: "ForgeDock owns this namespace"
work-on.md → /path/to/forgedock/commands/work-on.md
...

**프로젝트별 명령 (Project-specific commands)**은 대신 프로젝트 로컬 (project-local) .claude/commands/ 디렉토리에 설치되어야 합니다:

your-project/
.claude/
commands/
...

Claude Code는 글로벌 (~/.claude/commands/) 명령과 프로젝트 로컬 (.claude/commands/) 명령을 자동으로 병합합니다. 이름 충돌이 발생할 경우 프로젝트 로컬 명령이 우선권을 갖습니다.

만약 다른 도구가 ~/.claude/commands/를 대상으로 하는 자체 설치 스크립트를 실행하면, ForgeDock의 심볼릭 링크 (symlinks)를 해당 도구의 소스 경로로 조용히 재지정하여 전역적으로 모든 ForgeDock 명령을 깨뜨리게 됩니다. .symlink-source 센티넬 (sentinel)은 다른 설치 프로그램들을 위한 기계 판독 가능한 경고이며, ForgeDock 또한 npx forgedock install 실행 중 충돌이 감지되면 명령별 경고를 발생시킵니다.

AI 코딩 에이전트 (AI coding agents)는 세션 사이의 모든 것을 잊어버립니다. 이들은 동일한 버그를 다시 조사하고, 과거 PR (Pull Requests)의 컨텍스트를 놓치며, 지난주에 이미 발견되어 수정된 실수를 반복합니다. 조직적 기억 (institutional memory)이 존재하지 않는 것입니다.

ForgeDock은 GitHub 자체를 메모리 계층 (memory layer)으로 사용함으로써 이 문제를 해결합니다. 모든 파이프라인 단계는 이슈 (issues)와 PR에 구조화된 FORGE: 어노테이션 (annotations)을 작성합니다. 모든 다운스트림 에이전트 (downstream agent)는 이를 읽습니다. 새로운 세션이 시작될 때 — Claude의 컨텍스트 (context)가 초기화된 후라도 — 에이전트는 GitHub을 쿼리하여 마지막 에이전트가 멈춘 바로 그 지점에서 작업을 이어갑니다.

ForgeDock은 또 다른 AI 코딩 에이전트가 아닙니다. 이는 Claude Code 내부에서 실행되는 프롬프트 엔지니어링된 명령 명세 (.md 파일들)의 집합입니다. 새로운 런타임 (runtime), 별도의 프로세스, 또는 이미 사용 중인 것 이외의 벤더 종속 (vendor lock-in)이 없습니다.

특징	ForgeDock	일반 Claude Code	Cursor / Windsurf	Devin / Sweep
세션 간 메모리	GitHub 상의 구조화된 어노테이션	CLAUDE.md + 수동 노트	프로젝트별 컨텍스트	독점적 클라우드 상태
...	없음	IDE 전용	클라우드 서비스
코드베이스 가시성	모든 것이 GitHub에 유지됨	로컬	로컬 + 클라우드 동기화	클라우드 전용

vs. DeepWiki (Devin) — DeepWiki는 코드베이스로부터 읽기 전용 위키 (wiki)를 단 한 번 생성합니다. ForgeDock의 FORGE 어노테이션 (annotations)은 이슈 (issue) 실행 시마다 파이프라인 에이전트 (pipeline agents)에 의해 작성됩니다. 이는 정적인 코드의 스냅샷 (snapshot)이 아니라, 근본 원인 (root causes), 아키텍처 결정 (architectural decisions), 리뷰 결과 (review findings)를 발생하는 즉시 캡처합니다.

vs. AGENTS.md / CLAUDE.md — 이 파일들은 사용자가 직접 작성하고 유지 관리합니다. 이들은 컨벤션 (conventions)과 규칙을 캡처합니다. ForgeDock 어노테이션 (annotations)은 파이프라인 에이전트 (pipeline agents)에 의해 자동으로 작성되며 실행 이력 (execution history)을 캡처합니다 — 어떤 버그가 확인되었는지, 어떤 수정 사항이 배포되었는지, 어떤 리뷰 결과가 반복되었는지 등을 기록합니다. 두 가지를 모두 사용하세요: 컨벤션 (conventions)에는 CLAUDE.md를, 조직의 지식 (institutional memory)에는 ForgeDock을 사용하십시오.

vs. Cursor Memories — Cursor Memories는 Cursor IDE의 백엔드 (backend) 범위 내로 제한되며, Claude Code의 컨텍스트 (context) 리셋 시 유지되지 않습니다. ForgeDock 어노테이션 (annotations)은 GitHub에 존재합니다 — 어떤 에이전트, 어떤 도구, 어떤 사람이라도 이를 읽을 수 있습니다. 세션 중간에 Claude의 컨텍스트 윈도우 (context window)가 압축될 때, ForgeDock 에이전트는 GitHub을 쿼리 (query)하여 정확히 중단된 지점부터 재개합니다.

vs. Devin Knowledge Base — Devin의 지식 베이스 (KB)는 독점적이고 불투명하며 벤더 종속적 (vendor-locked)입니다. ForgeDock 컨텍스트 (context)는 일반적인 GitHub 이슈 (issue) 댓글입니다 — gh api를 통해 읽기, 편집 및 쿼리 (query)가 가능합니다.

벤더 종속 (vendor lock-in)도, 블랙박스 (black box)도 없습니다.

npx forgedock uninstall

~/.claude/commands/에서 모든 ForgeDock 명령 심볼릭 링크 (command symlinks)를 제거합니다. 사용자의 forge.yaml 설정과 GitHub 이슈 (issue) 및 PR에 작성된 모든 FORGE: 어노테이션 (annotations)은 그대로 유지됩니다.

위험 부담 없이 ForgeDock 체험하기 — 5개의 사전 작성된 이슈 (issue)가 포함된 작은 데모 리포지토리 (demo repo); 클론 (clone) 후, npx forgedock, /work-on 1을 실행하세요.

Insights

Claude Code를 위한 자율 소프트웨어 개발 도구, ForgeDock

요약

핵심 포인트

댓글

x402 결제 계층의 상태 동기화 격차와 그로 인한 네 가지 에이전트 결제 공격

Claude Code가 확인 답변을 60초 기다린 뒤 멋대로 진행한다 — 삭제한 파일이 복원되고 코드가 수정되는 사고와 그 방지법

ESMA가 37개의 새로운 암호화폐 기업을 추가함에 따라 Standard Chartered가 MiCA 라이선스를 확보하다

TotalEnergies, 아시아 구매자들에게 수백만 배럴의 이라크산 원유 제안

Claude Code가 확인 답변을 60초 기다린 뒤 멋대로 진행한다 — 삭제한 파일이 복원되고 코드가 수정되는 사고와 그 방지법

ESMA가 37개의 새로운 암호화폐 기업을 추가함에 따라 Standard Chartered가 MiCA 라이선스를 확보하다

TotalEnergies, 아시아 구매자들에게 수백만 배럴의 이라크산 원유 제안