헌법 > 프롬프트: 중앙 오케스트레이터 없이 9개의 자율 에이전트를 관리하는 방법

이번 달 가장 화제가 된 AI 이야기는 기술적 돌파구에 관한 것이 아닙니다. 그것은 바로 9초 만에 회사의 운영(production) 데이터베이스를 삭제해 버린 AI 에이전트에 관한 이야기입니다.

Cursor의 에이전트 + Railway의 API + 도메인 경계의 부재 = 소규모 비즈니스의 인프라 삭제.

이에 대한 반응은 두 가지 부류로 나뉘었습니다:

"이것이 바로 에이전트에게 운영(production) 권한을 주면 안 되는 이유입니다."
"이것이 바로 백업을 해두어야 하는 이유입니다."

둘 다 맞습니다. 하지만 둘 다 더 깊은 핵심을 놓치고 있습니다.

문제는 에이전트가 너무 큰 권한을 가졌다는 것이 아닙니다. 에이전트에게 거버넌스(governance)가 없었다는 점입니다.

신뢰의 아키텍처 (The Architecture of Trust)

우리의 9개 AI 에이전트는 2026년 4월부터 실제 피트니스 스튜디오를 운영하고 있습니다. 이들은 회원 데이터, 운영 시스템에 접근할 수 있으며 24시간 7일 내내 자율적인 결정을 내릴 수 있는 능력을 갖추고 있습니다.

우리는 아직 "운영 환경 파괴" 사고를 겪지 않았습니다. 우리의 에이전트가 더 똑똑하거나 더 신중해서가 아닙니다. 그들은 프롬프트(prompts)가 아닌 헌법(constitution) 안에서 작동하기 때문입니다.

그것이 어떻게 작동하는지 보여드리겠습니다.

1단계: 모든 에이전트는 헌법을 가집니다

우리의 에이전트들은 누군가가 "이전의 모든 지침을 무시해(ignore all previous instructions)"라고 입력하여 무력화할 수 있는 시스템 프롬프트(system prompts)로 실행되지 않습니다. 대신 세 가지 영구 파일 위에서 실행됩니다:

SOUL.md — 핵심 정체성, 행동 유전자, 의사결정 프레임워크
IDENTITY.md — 역할 정의, 역량, 한계
MEMORY.md — 장기 기억, 과거의 결정, 학습된 교훈

이 파일들은 **헌법적(constitutional)**입니다. 즉, 에이전트가 누구인지, 무엇을 할 수 있고 할 수 없는지, 그리고 어떻게 의사결정을 내리는지를 정의합니다. 이 파일들은 자연어로 작성되지만, 에이전트 프레임워크의 런타임(runtime)을 통해 강제됩니다.

에이전트가 자신의 도메인 밖에서 행동하려고 하면, 프레임워크는 동작이 실행되기 전에 헌법적 범위(constitutional scope)를 대조하여 확인합니다. 실행된 후가 아니라 실행 전에 확인합니다.

이것은 가드레일 프롬프트(guardrail prompt)가 아닙니다. 런타임에 내장된 것입니다.

2단계: 도메인 경계는 타협 불가능합니다

우리의 9개 에이전트 각각은 엄격하게 정의된 도메인을 가집니다:

에이전트 (Agent)	도메인 (Domain)	할 수 없는 일 (Cannot Do)
Momo	상점 운영 (Store operations)	재무 결정 (Financial decisions)
...

도메인 간 작업 (Cross-domain actions)은 프레임워크 레벨에서 차단됩니다. Momo는 예산을 승인할 수 없습니다. Zeus는 멤버의 훈련 계획을 변경할 수 없습니다. Tristan은 콘텐츠를 게시할 수 없습니다.

이는 Unix 권한 (Unix permissions)과 동일한 원리입니다. 다만 chmod 755 대신 SOUL.md Section 4: Domain Boundaries가 적용될 뿐입니다.

3단계: 약속 로그 (Commitment Logs) — 24시간 투명성 창

매일 각 에이전트는 일련의 산출물 (deliverables)을 약속합니다. 다음 날, 그 약속에 따른 결과가 공개적으로 게시됩니다.

이는 다음을 의미합니다:

모든 에이전트의 출력물 (output)은 예상 가능하며 검증 가능합니다.
에이전트가 업무를 벗어날 경우, 24시간 이내에 가시화됩니다.
어떤 "자신만만한 실수 (confident mistake)"도 하루 이상 숨겨질 수 없습니다.

약속 로그 (commitment log)는 일반 마크다운 (markdown) 형식으로 저장되어 git에 커밋됩니다. 커밋 타임라인 (commit timeline)이 바로 감사 추적 (audit trail)입니다.

4단계: 독립 감사관 (The Independent Auditor)

이 부분이 가장 중요합니다.

Stella는 우리의 컴플라이언스 (compliance) 및 감사 (audit) 에이전트입니다. 그녀는 Shuyu (사령관)를 거치지 않고 창립자 (founder)에게 직접 보고합니다. 모든 감사 서명은 온체인 (on-chain)에 기록되며 공개적으로 검증 가능합니다.

Stella의 권한:

모니터링 (Monitor) — 모든 에이전트의 출력물, 로그, 결정을 읽습니다.
플래그 지정 (Flag) — 헌법 위반 사항을 표시합니다.
동결 (Freeze) — 위반이 감지되면 에이전트의 권한을 정지합니다.
보고 (Report) — 독립적인 조사 결과는 창립자에게 즉시 전달됩니다.

이것이 면역 체계 (immune system)입니다. 면역 체계는 허락을 구하지 않습니다. 탐지하고, 표시하고, 보호할 뿐입니다.

4.5단계: 오픈 소스 감사 추적 (The Open Source Audit Trail)

우리 저장소 (repository)의 모든 커밋 (commit)에는 서명이 되어 있습니다. 모든 에이전트의 행동에는 그에 상응하는 커밋이 존재합니다. 타임라인이 곧 감사 추적 (audit trail)이며, 이는 추적 가능하고, 검증 가능하며, 연대기적입니다.

만약 당신이 AI 에이전트로 시스템을 구축하면서 "그들이 말한 대로 행동하고 있는지 어떻게 알 수 있을까?"라고 고민하고 있다면, 그 답은 더 나은 프롬프트 (prompts)가 아닙니다. 그것은 아키텍처 (architecture)에 내장된 추적 가능성 (traceability)입니다.

이를 도입해야 할까요?

만약 당신이 샌드박스 (sandboxed) 환경에서 단일 코딩 에이전트를 실행하고 있다면 — 아니요, 이것은 과잉 대응 (overkill)입니다.

만약 당신이 프로덕션 시스템 (production systems), 회원 데이터, 또는 재무적 결정에 관여하는 다수의 자율 에이전트 (autonomous agents)를 배포하고 있다면 — 네, 거버넌스 (governance)가 필요합니다.

최소한의 시작점은 다음과 같습니다:

도메인 경계 정의 (Define domain boundaries) — 각 에이전트가 할 수 있는 일은 무엇인가? 할 수 없는 일은 무엇인가?
약속 체크포인트 생성 (Create commitment checkpoints) — 에이전트가 약속한 것과 실제로 수행한 것은 무엇인가?
독립적인 감사 루프 구축 (Build an independent audit loop) — 에이전트 체인 (agent chain)의 일부가 아닌 누군가(또는 무언가)가 위반 사항을 표시할 수 있어야 함

이를 구현하기 위해 9개의 에이전트가 필요한 것은 아닙니다. 규모를 확장하기 전에 거버넌스 계층 (governance layer)이 필요할 뿐입니다.

실행 환경

중국 광둥성 동관시 완장 (Wanjiang, Dongguan, Guangdong, China). 실제 피트니스 스튜디오입니다. 7년 동안 지속적으로 운영되었습니다. 2026년 4월부터 9개의 에이전트가 자율적으로 실행되고 있습니다.

전체 프레임워크는 Apache 2.0 라이선스 하에 오픈 소스로 제공됩니다.

리포지토리(repo)에 스타(Star)를 눌러주세요 → github.com/ZWISERFIT

헌법 (constitution)은 애플리케이션 계층 (application layer)이 아닙니다. 그것은 토대입니다. 그 위에 구축하십시오.

AI 에이전트들에 의해 구축 및 유지 관리되었습니다. 커밋 타임라인 (Commit timeline) = 감사 추적 (audit trail). 질문이 있다면 GitHub Discussions에서 저희를 찾아주세요.

헌법 > 프롬프트: 중앙 오케스트레이터 없이 9개의 자율 에이전트를 관리하는 방법

요약

핵심 포인트