Forge Method란 무엇인가? 에이전트의 즉흥적인 행동을 멈추게 하는 5가지 규칙
요약
AI 에이전트의 즉흥적인 행동과 토큰 낭비를 방지하기 위한 'Forge Method' 프레임워크를 소개합니다. 태스크를 단순한 명령이 아닌 '계약'으로 간주하고, 구조화된 규칙을 통해 에이전트의 예측 가능성을 높이는 방법을 다룹니다.
핵심 포인트
- 태스크는 단순한 요청이 아닌 명확한 '계약'이어야 함
- O(Output defined): 결과물의 상태를 구체적이고 확인 가능하게 정의
- R(Requirements first): 에이전트가 추측하지 않도록 모든 요구사항을 우선 제공
첫 번째 포스트에서 저는 이런 이야기를 들려드렸습니다. 20년 차 개발자로서 AI에 대해 겁을 먹었던 6개월, 800달러의 토큰(tokens) 낭비, 그리고 반복되는 실패를 통해 저에게 제대로 요청하는 법을 가르쳐준 Claudio라는 이름의 고집 센 에이전트에 대한 이야기 말입니다.
이 포스트는 그 모든 고통 끝에 나온 방법론입니다. FORGE의 각 철자 하나당 하나의 규칙, 총 다섯 가지 규칙입니다.
미리 솔직하게 한 가지 말씀드리겠습니다. 이것은 제가 화이트보드 앞에서 발명해낸 프레임워크(framework)가 아닙니다. 여기에 담긴 모든 규칙은 흉터입니다. 각각의 규칙은 저에게 돈, 시간, 혹은 잠을 앗아갔던 특정한 실수로부터 얻은 교훈입니다. 저는 먼저 실수를 말씀드리고, 그다음에 규칙을 말씀드릴 것입니다. 왜냐하면 규칙은 그것을 만든 고통을 직접 느껴본 후에야 비로소 의미가 있기 때문입니다.
시작해 봅시다.
먼저, 이 모든 것의 이면에 있는 아이디어
제가 시작했을 때 아무도 말해주지 않았던 사실이 있습니다:
태스크(task)는 포스트잇이 아닙니다. 그것은 계약(contract)입니다.
구조(structure) 없이 AI 에이전트(agent)에게 무언가를 요청하는 것은 명령을 내리는 것이 아니라 도박을 하는 것입니다. 에이전트는 해석하고, 가정하고, 즉흥적으로 행동하며, 그 결과는 에이전트가 스스로 얼마나 많은 컨텍스트(context)를 재구성해냈느냐에 달려 있습니다. 때로는 운 좋게 맞히기도 하지만, 대개는 틀립니다. 그리고 토큰(tokens)이 다 소진된 후에야 그 사실을 알게 됩니다.
Forge Method는 당신과 에이전트 사이의 합의입니다: **당신은 구조를 제공하고
테스트: 맥락 없이 제목만 읽어보세요. 도메인(domain), 행동(action), 그리고 범위(scope)를 알 수 있나요? 만약 그렇지 않다면, 다른 무엇을 하기 전에 제목을 다시 작성하세요.
O — Output defined (출력 정의)
실수: 저는 "출력: 완료(Output: Done)"라고 쓰고 실행 버튼을 눌렀습니다. 그러면 에이전트가 작업을 마쳤을 때, 저는 그것이 실제로 완료된 것인지 알 방법이 없었습니다. 왜냐하면 무엇이 '완료'된 상태인지 스스로 결정한 적이 없었기 때문입니다. 저는 존재하지도 않는 정의를 기준으로 작업 결과물을 검토하고 있었습니다.
규칙: "완료"된 상태가 어떤 모습인지 모른다면, 에이전트도 모릅니다.
결과물은 시작하기 전에 구체적이고 확인 가능해야 합니다. "작동하게 만들어라"가 아니라, "Z라는 동작을 수행하며, Y 경로에 있는 X 파일을 생성하라"와 같아야 합니다.
❌ 거절됨:
- "출력: 완료 (Output: Done)"
- "출력: 수정됨 (Output: Fixed)"
- "출력: 구현됨 (Output: Implemented)"
✅ 수락됨:
- "출력: 인덱스가 포함된 users 테이블을 추가하는 PostgreSQL 마이그레이션 파일, 위치: db/migrations/20250531_users.sql"
테스트: 코드를 실행하지 않고도 출력을 확인할 수 있나요? 결과가 맞는지 알기 위해 해석(interpret) 과정이 필요하다면, 그것은 충분히 정의되지 않은 것입니다.
R — Requirements first (요구사항 우선)
실수: 이것이 가장 뼈아픈 실수였습니다. 저는 무언가를 요청하면서 에이전트가 맥락(context)—파일, 제약 조건(constraints), 그리고 세 번 전의 채팅에서 언급했던 내용들—을 "알고 있을 것"이라고 가정했습니다. 하지만 에이전트는 알지 못했습니다. 그래서 에이전트는 자신이 할 수 있는 유일한 방법으로 그 빈틈을 채웠습니다. 바로 그것들을 '발명'해내는 것이었습니다. 이것은 에이전트가 멍청해서 발생하는 문제가 아닙니다. 정보가 누락되었을 때 당신이 할 법한 행동, 즉 '추측'을 에이전트가 정확히 수행하고 있는 것입니다. 그리고 코드처럼 보이는 자신만만한 추측은 가장 비용이 많이 드는 오류입니다.
규칙: 맥락이 없으면 에이전트는 환각(hallucinate)을 일으킵니다.
모든 입력값과 의존성(dependency)을 사전에 선언해야 합니다: 파일, 링크, API, 제약 조건, 그리고 — 이 부분이 매우 중요합니다 — 무엇을 건드리지 말아야 하는지까지 말입니다.
❌ 거절됨:
- "입력: 없음 (Input: None)"
- "입력: 평소 하던 것들 (Input: the usual stuff)"
- "입력: 당신도 알다시피 (Input: you know)"
✅ 수락됨:
입력:
- Figma 파일: figma.com/file/abc123
- 인증 미들웨어 (Auth middleware): src/middleware/auth.ts
...
테스트: 에이전트가 당신에게 단 하나의 질문도 하지 않고 작업을 시작할 수 있나요? 만약 그렇지 않다면, 맥락이 누락된 것입니다.
G — Granular
G — Granular (세분화)
실수: 저는 양극단을 오갔습니다.
테스트: NOTES.md에 기록되어 있는가? 만약 오류가 두 번 발생했는데 문서화되어 있지 않다면, 당신은 E를 통과하지 못한 것입니다.
왜 "Forge"인가
사람들은 제가 이 약어(acronym)를 귀엽게 보이려고 역으로 맞춘 것이라고 생각합니다. 그렇지 않습니다.
이 규칙들이 존재하기 전부터, 저는 이미 Forge라고 부르는 개인용 도구를 만드는 데 3개월을 보냈습니다. 이는 저의 AI 어시스턴트들과 그들이 만들어낸 결과물(artifacts)을 관리하는 공간이었습니다. 그래서 이름은 이미 제 머릿속에 있었습니다. 다섯 가지 규칙이 자리를 잡았을 때, 글자들이 딱 맞아떨어졌습니다. F, O, R, G, E. 아무리 계획하려 노력해도 이보다 더 잘 맞출 수는 없었을 것입니다. 정말로 계획한 것이 아니었습니다.
그리고 은유(metaphor) 또한 일치했습니다. 저는 주말에 목공을 합니다. 손으로 무언가를 모양 잡는 것을 좋아하죠. 최고의 작업물은 즉흥적으로 만들어지지 않습니다. 그것들은 실전에 투입되기 전에 모양이 잡히고, 망치질 당하고, 단단해집니다. 그것들은 단련(forged)됩니다. 나쁜 작업물들은 처음 기대고 서는 순간 산산조각이 납니다.
실제로 단련된(forged) 작업이란 어떤 모습인가
전체 내용을 템플릿으로 정리했습니다. 가져다 쓰세요.
title: auth service의 JWT 만료 설정 수정
input:
...
그리고 무엇인가를 실행하기 전 30초간의 체크리스트입니다:
F — 제목이 2단어 이상이며 구체적인가?
O — 정확한 결과물(deliverable)을 정의했는가?
R — 모든 입력값(input)을 선언했는가?
G — 하위 작업(subtasks)이 2개에서 5개 사이인가?
E — 알려진 오류에 대해 NOTES.md를 확인했는가?
다섯 가지 체크를 모두 통과했다면, 진행하세요. 만약 하나라도 "아니오"라면, 먼저 다시 작성하세요. 이는 단 30초가 소요됩니다. 하지만 이를 건너뛰는 대가로 저는 800달러를 잃었습니다.
제가 파는 것은 이론이 아닙니다
제가 이 다섯 가지 규칙을 신뢰하는 이유는 제가 만드는 모든 것이 이 규칙 위에서 작동하기 때문입니다. MC-MONKEYS와 MC-Taski 모두 Forge Method를 기반으로 실행됩니다. 이것은 부가 기능이 아니라, 그것들이 작동하는 이유 그 자체입니다.
다음 포스트에서는 정확히 어떻게 하는지 보여드리겠습니다. 저의 8개 에이전트 팀과 운영 책임자(Chief of Operations)인 Lucy가 어떻게 Forge 규칙을 작업 방식에 내재화하여, 잘못 형성된 작업이 단 하나의 토큰(token)이라도 낭비하기 전에 거부되도록 하는지 보여드릴 것입니다.
그것이 포스트 #3입니다. 거기서 뵙겠습니다.
— Billy
MC-STUDIO 소개
저는 Billy입니다 — 저는 문서를 읽기보다 프롬프트(prompt)를 입력하는 것을 선호하는 사람들을 위한 디지털 도구를 만듭니다. 제가 만드는 모든 것은 MC-Studio에서 운영됩니다.
함께 소통해요: mc-studio.ar
지금까지 출시한 제품들:
🐵** MC-MONKEYS** — Lucy(저의 운영 책임자, Chief of Operations)가 조정하고 Forge Method의 통제를 받는, Claude Code에서 함께 협업하는 8명의 전문 AI 에이전트로 구성된 가상 에이전시입니다 → mc-studio.ar/products/mc-monkeys
⚡** MC-Taski** — Claude Code를 통해 수정 작업을 자동화하세요. 타이핑하고, 재생 버튼을 누르고, 커피 한 잔을 즐기세요 → mc-studio.ar/products/mc-taski
저는 성공, 실수, 그리고 과장 없는(zero hype) 과정을 실시간으로 공유합니다:
📸** Instagram:** @mc.studio.ai
🐦 X / Twitter: @billymcmonkeys
저는 AI 에이전트(AI agents), Forge Method, 그리고 Claude Code를 활용한 빌딩(building)에 대해 글을 씁니다. 이 시리즈의 다음 포스트를 놓치지 않으려면 dev.to에서 저를 팔로우하세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기