본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 06. 03. 15:28

자기 진화의 두 가지 척도: RMSP 에이전트와 AGE 방법론 사이의 깊은 구조적 대응 관계

요약

RMSP 에이전트의 내부 구조 진화와 AGE 방법론의 저장소 안정화 사이의 구조적 대응 관계를 분석합니다. 에이전트의 행동 토폴로지 조정과 소프트웨어 저장소의 불변 계약 유지를 통한 자기 조직화 메커니즘을 다룹니다.

핵심 포인트

  • RMSP는 에이전트의 내부 행동 토폴로지를 초 단위로 진화시킴
  • AGE는 저장소 수준의 불변 계약을 일 단위로 안정화함
  • 두 방식은 상호 보완적이며 구조적 자기 조직화를 지향함
  • nop-chaos-flux는 AGE를 프레임워크 수준에서 구현한 사례임

초록 (Abstract): RMSP (Reward-Modulated Structural Plasticity, 보상 변조 구조 가소성)는 에이전트의 행동 토폴로지 (behavioral topology)가 사용을 통해 스스로 진화하는 새로운 패러다임을 제안합니다. AGE (Attractor-Guided Engineering, 어트랙터 유도 엔지니어링)는 소프트웨어 저장소 (repository)가 고빈도 AI 섭동 (perturbations) 하에서도 지속적으로 수렴할 수 있게 하는 방법론을 제안합니다. 이 두 가지는 경쟁하는 접근 방식이 아닙니다. RMSP는 에이전트의 내부 구조를 조정하며 (초 단위), AGE는 저장소 수준의 불변 계약 (invariant contracts)을 안정화합니다 (일 단위). nop-chaos-flux는 프레임워크 수준에서 AGE를 완전히 구현한 것입니다. 이 프로젝트의 소유자 문서 (owner-doc) 시스템은 책임 분할 (split), 고수준 추상화 (lift), 오래된 구조 제거 (prune), 상호 참조 (connect)라는 네 가지 방향으로 구조적 진화를 거쳤으며, 이는 RMSP의 6가지 재작성 규칙 (rewrite rules)에 의해 주도되는 구조적 자기 조직화 (structural self-organization)와 정확히 일치합니다. 본 논문은 이러한 교차 척도 구조적 대응 관계를 분석하고 두 방식의 상호 보완적 경계를 논의합니다.

출처:

  1. RMSP 논문Self-Evolving LLM Agents as LLM + MAN: A New Agent Paradigm via Reward-Modulated Structural Plasticity, 전문은 mp.weixin.qq.com/s/HYCq2mKlIaSCRAJIp92NGQ에서 확인 가능
  2. AGE 템플릿attractor-guided-engineering-template, github.com/entropy-cloud/attractor-guided-engineering-template
  3. nop-chaos-flux 실습github.com/entropy-cloud/nop-chaos-flux

1. 핵심 제안 비교

차원 (Dimension)RMSP 에이전트 패러다임 (RMSP Agent Paradigm)AGE 방법론 (AGE Methodology)nop-chaos-flux 실천 (nop-chaos-flux Practice)
핵심 진단 (Core Diagnosis)현재의 에이전트 = 저작물 (authoring artifact), 구조는 정적임현재의 AI 개발은 저장소 구조 자체가 수렴하도록 두기보다, 행동을 제약하기 위해 외부 도구에 의존함 (harness-first)고빈도 AI 섭동 (perturbations) 하에서, 저장소는 검증 가능한 신뢰할 수 있는 단일 출처 (source of truth)가 되어야 함
...

세 가지 패러다임 모두 동일한 관찰에서 기원합니다: 정적인 구조는 상호작용을 통해 적응적으로 진화할 수 없으며, 반드시 어떤 형태의 가소성 (plasticity) 메커니즘이 도입되어야 합니다.

2. 세 가지 규모에서의 구조적 가소성 (Structural Plasticity)

구조적 가소성은 세 가지 뚜렷한 시간 규모 (time scales)에서 발생합니다.

규모 1: 에이전트 런타임 (Agent Runtime) — RMSP/MAN

RMSP는 에이전트의 행동 토폴로지 (topology)를 애스펙트 그래프 (aspect graph)로 모델링합니다. 각 애스펙트 (aspect, 포인트컷 매칭 조건과 어드바이스 처리 로직을 포함하는 책임 영역)는 최근의 성능을 추적하는 자체 슬라이딩 윈도우 (sliding window)를 가집니다.

각 상호작용 이후, 보상 (reward)은 결정에 참여한 애스펙트들에게 분배되어 기여도 값 (contribution values)으로 축적됩니다. 특정 애스펙트의 크레딧 분산 (credit variance)이 임계값을 초과하면, 여섯 가지 재작성 규칙 (rewrite rules) 중 하나가 트리거됩니다. split은 분산이 높은 애스펙트를 두 개의 전문화된 애스펙트로 나눕니다 (하향식 차별화, top-down differentiation); lift는 함께 활성화되는 애스펙트 클러스터를 더 높은 수준의 코디네이터로 추상화합니다 (상향식 추상화, bottom-up abstraction); connect/prune은 엣지 (edge)의 진화와 제거를 관리합니다. LLM은 새로운 구조를 제안할 수 있지만, 이는 반드시 이중 게이팅 (dual gating)—κ 추정 (기대 이익 평가) 및 F-score (Surprise + β·Complexity)—을 통과한 후에만 커밋될 수 있습니다. 즉, 생성 (generation)과 검증 (verification)은 반드시 분리되어야 합니다.

MAN은 에이전트를 명시적으로 두 개의 시스템으로 나눕니다: LLM은 현재 라운드에서의 빠른 추론과 생성을 담당하는 System 1이며, aspect network는 구조적 거버넌스(governance), 스케줄링(scheduling), 그리고 자기 진화(self-evolution)를 담당하는 System 2입니다. 빠른 경로($\Downarrow_{fast}$)는 고정된 토폴로지(topology) 하에서 단일 추론을 완료하며, 느린 경로($\Downarrow_{slow}$)는 충분한 신호가 축적된 후에만 그래프 구조를 변경합니다. LLM이 실행기(effector)라면, MAN은 신경계(nervous system)입니다. 즉, 이 둘은 서로 다른 시간 척도(time scales)에서 전문화됩니다.

Scale 2: AI 개발 세션 — AGE 계획/종료/감사 (Plan/Closure/Audit)

AGE는 각 개발 작업을 하나의 수렴 사이클(convergence cycle)로 구성합니다: input/ $\rightarrow$ discussions/ $\rightarrow$ requirements/ $\rightarrow$ design/ + architecture/ $\rightarrow$ plans/ $\rightarrow$ 구현(implement) $\rightarrow$ 검증(verify) $\rightarrow$ 종료(close).

여기서 성장하는 것은 aspect graph가 아니라, 계획 문서(plan documents), 종료 게이트 판단(closure gate judgments), 그리고 감사 기록(audit records)입니다. 각 작업에 의해 트리거되는 이 사이클은 요구사항을 모호함에서 구현 준비 단계로 밀어붙이는 동시에, 안정적인 설계 의도(design intentions)를 design/architecture/ (즉, 어트랙터(attractors))에 저장합니다. 각 계획 실행 후에는 독립적인 세션이 종료 감사(closure audit)를 수행해야 하며, 구현자(implementer)가 스스로 완료를 보고할 수 없습니다.

nop-chaos-flux에서 이 사이클은 24개의 계획 규칙, 3개의 상태 레벨, 그리고 심층 감사(deep-audit)로 강화되었습니다. Plan 143은 전형적인 사례입니다: 종료 가정(closure assumptions)들이 2026-04-26과 2026-04-27에 실시된 독립 감사에 의해 차례로 뒤집혔으며, 라이브 리포지토리(live repo)가 실제로 임계값(threshold)을 통과한 후에야 비로소 종료가 허용되었습니다.

Scale 3: 장기 프로젝트 진화 — AGE 어트랙터 / 소유자-문서 시스템 (Attractor / Owner-Doc System)

가장 느린 계층은 docs/architecture/ 문서 트리 자체의 변화입니다. 새로운 아키텍처 문서가 analysis/ 또는 plans/에서 안정적인 아키텍처 문서로 승격되며, 오래된 구조는 제외됩니다 (예: CompiledSchemaNode 제거). 아키텍처 계층은 더욱 심화됩니다 (더 적은 패키지 계층에서 flux-compiler, flux-action-core, flux-runtime의 3개 계층으로 확장되어, flux-core → flux-compiler → flux-action-core → flux-runtime → flux-react로 이어지는 5단계 파이프라인을 형성함).

이 계층에서의 변화는 세션 수준의 작업(session-level tasks)에 의해 구동되는 것이 아니라, 세션을 넘나드는 설계 결정(cross-session design decisions)의 축적과 심층 감사(deep-audits)를 통한 발견에 의해 구동됩니다. 소유자 문서(owner-docs)와 실제 저장소(live repo) 사이의 불일치를 발견하는 각각의 심층 감사는 구조적 교정(structural correction) 과정을 트리거합니다. 교정 후, 프로젝트는 더 정밀한 어트랙터(attractor)의 근방으로 돌아갑니다.

에이전트 내부 (RMSP)세션 제어 (AGE Plan)프로젝트 진화 (AGE Attractor)
시간 규모상호작용당작업당 (시간 ~ 일 단위)주 단위 ~ 월 단위
...

3. 개념적 매핑 (Conceptual Mapping)

Aspect ↔ 소유자 문서 (Owner-Doc)

RMSP의 Aspect(양상)는 에이전트 내부의 최소 행동 단위(pointcut + advice + sliding window)입니다. AGE의 소유자 문서(owner-doc)는 프로젝트 지식의 최소 안정 단위(설계 의도 + 계약 + 선례)입니다.

두 개념 모두 최소 구조적 단위이며, 분할/병합/승격(split/merge/lift)이 가능하고, 각각 고유의 "pointcut"(트리거 시점, docs/index.md 라우팅)과 "advice"(트리거 후의 동작)를 가집니다.

핵심 차이점: Aspect는 보상(reward)에 의해 자동으로 성장하며 단일 에이전트 인스턴스에 종속적이지만, 소유자 문서는 인간과 AI가 협업하여 작성하며 버전 관리(versioned)가 이루어지고 팀에 의해 공유됩니다.

재작성 규칙 (Rewrite Rules) ↔ 문서 진화 (Document Evolution)

RMSP 규칙 (Rule)AGE/nop-chaos-flux 대응 관계리포지토리 내 실제 사례
split (분할)하나의 아키텍처 문서가 여러 개의 좁은 범위의 문서로 분할됨flux-core.md에서 frontend-programming-model.md (최상위 명세), form-validation.md, renderer-runtime.md로 책임이 차별화됨
.........

보상 변조 (Reward Modulation) ↔ 감사 신호 (Audit Signal)

RMSP는 보상 (reward) → 신용 할당 (credit assignment) → 기여도 축적 (contribution accumulation) → 구조적 재작성 (structural rewrite) 과정을 사용합니다. AGE는 감사 결과 (audit finding) → 베이스라인 드리프트 탐지 (baseline drift detection) → 종료 게이트 조정 (closure gate adjustment) → 구조적 업데이트 (structural update) 과정을 사용합니다.

신호는 생성자(generator) 자체로부터 나와서는 안 되며, 이는 두 방식 모두가 공유하는 원칙입니다. RMSP에서 LLM은 구조 제안자(structure proposer)이고 보상은 검증자(verifier)인 반면, AGE에서는 구현자(implementer)가 완료 여부를 판단할 수 없으며 독립적인 세션이 종료 감사(closure audit)를 수행해야 합니다.

소프트 조언 (Soft Advice) ↔ 하드 제어 흐름 (Hard Control Flow)

RMSP와 AGE 모두 소프트 신호(soft signals)를 하드 제어 흐름(hard control flow)으로 변환합니다. RMSP에서 LLM이 제안한 새로운 구조는 측면 그래프(aspect graph)에 기록되기 전, κ 추정 및 F-score라는 하드 게이트(hard gates)를 반드시 통과해야 합니다. 이는 제안이 아니라 피할 수 없는 판결입니다. AGE에서도 종료 감사(closure audit) 결과는 마찬가지로

Slow Pathway ↔ 종료 감사 (Closure Audit)

RMSP의 느린 경로 (Slow Pathway)는 매번 빠른 추론 (Fast Inference)에 참여하지 않습니다. 대신 크레딧 (Credit)이 임계값에 도달한 후에만 구조적 재작성 (Structural Rewriting)을 트리거합니다. AGE의 종료 감사 (Closure Audit) 역시 일상적인 구현 과정에 참여하지 않으며, 계획 실행 (Plan Execution)이 완료된 후에만 독립적인 수렴 판단 (Convergence Judgment)을 수행합니다.

4. 핵심 차이점

자동화 수준 (Degree of Automation)

RMSP의 양상 성장 (Aspect Growth)은 완전히 자동적입니다. 보상 (Reward)이 인간의 개입 없이 모든 재작성 규칙 (Rewrite Rules)을 구동합니다. AGE의 어트랙터 진화 (Attractor Evolution)는 반자동적입니다. 인간과 AI의 협업을 통해 새로운 구조를 제안하며, 감사 게이팅 (Audit Gating)을 거친 후에 채택됩니다.

RMSP는 단일 에이전트의 온라인 학습 (Online Learning)—소규모, 밀집된 피드백—에 더 적합합니다. AGE는 저장소 수준의 지식 관리 (Repository-level Knowledge Management)—대규모, 희소한 피드백이지만 각 구조적 변화가 중대한 영향을 미침—에 더 적합합니다.

구조적 매개체 (Structural Carrier)

RMSP의 구조적 매개체는 런타임 양상 그래프 (Runtime Aspect Graph)입니다 (메모리 상에 존재하며, 에이전트 인스턴스별로 독립적임). AGE의 구조적 매개체는 저장소 파일 시스템 내의 소유자 문서 (Owner-doc)입니다 (디스크 상에 존재하며, 버전 관리 및 팀 공유가 가능함).

RMSP는 에이전트 인스턴스 간에 양상 그래프를 마이그레이션할 수 있습니다 (내보내기 → 가져오기). AGE는 여러 명의 인간과 여러 에이전트가 동일한 어트랙터를 공유하는 것을 자연스럽게 지원합니다 (버전 관리 + 차이점 검토 (Diff Review)).

평가 지표 (Evaluation Metric)

RMSP는 구조적 변화의 수용 여부를 일관되게 판단하기 위해 F = Surprise + β·Complexity를 사용합니다. 이 공식의 직관적인 의미는 "구조는 임대료를 지불해야 한다"는 것입니다. 즉, 새로운 구조는 자신의 복잡성 (Complexity)을 정당화하기 위해 반드시 오차 (Surprise)를 줄여야 합니다. AGE는 통일된 수치적 지표를 가지고 있지 않습니다. 대신 수렴을 평가하기 위해 다음과 같은 여러 실질적인 신호들을 사용합니다: 타입 체크 (Typecheck)/빌드 (Build)/테스트 (Test) 통과 여부, 소유자 문서가 실제 저장소와 일치하는지 여부, 종료 감사 (Closure Audit)가 완료를 검증하는지 여부 등입니다.

에이전트 런타임 시점의 상태 공간(aspect graph × memory × tool calls)은 소프트웨어 저장소의 상태 공간(files × dependencies × behaviors × tests × docs × configuration)보다 훨씬 작습니다. 작은 상태 공간에서는 통합된 수치적 평가 함수(unified numerical evaluation function)가 실행 가능하지만, 큰 상태 공간에서는 평가가 여러 직교 신호(orthogonal signals)의 조합으로 분해되어야 합니다.

적응 (Adaptation) vs. 수렴 (Convergence)

RMSP의 목표는 적응(adaptation)입니다. 즉, 에이전트가 현재 사용자에게 더 잘 적응하도록 하여 (F가 감소하는 한) aspect graph가 지속적으로 표류(drift)할 수 있도록 하는 것입니다. 반면 AGE의 목표는 수렴(convergence)입니다. 시스템이 미리 정의된 끌개(attractors)를 향해 수렴하며, 여기서 벗어난 구조는 하네스(harness)에 의해 다시 끌어당겨집니다.

nop-chaos-flux는 "범위 내 변경(scope-in changes)"과 "끌개 업데이트(attractor updates)"를 엄격히 구분함으로써 이를 관리합니다. 설계 변경은 반드시 소유자 문서(owner-doc) 업데이트와 종료 감사(closure audit)를 모두 거쳐야 하며, 조용한 베이스라인 이동(silent baseline shifts)은 허용되지 않습니다.

시간 병진 불변성 (Time-Translation Invariance)

RMSP는 에이전트가 연속적으로 존재한다고 가정합니다. 최소한 하나의 세션 동안은 실행 중이며, 메모리 내의 aspect graph가 존재하고, 보상 신호(reward signals)가 지속적으로 축적되며, 상호작용 사이에 구조적 재작성(structural rewriting)이 자연스럽게 일어나는 상태를 의미합니다.

AGE는 다른 제약 조건에 직면합니다. 사용자가 창을 닫으면 AI 세션은 사라집니다. 오늘은 에이전트 A가 동일한 저장소를 수정하고, 내일은 에이전트 B가 이를 감사하며, 모레는 에이전트 C가 개발을 이어갑니다. 이 세 에이전트 모두 동일한 저장소를 보고, 동일한 소유자 문서를 읽으며, 동일한 라이브 저장소를 기준으로 종료(closure)를 판단해야 합니다. AGE의 모든 상태 입력과 출력은 파일 시스템을 통과합니다. 이는 설계상의 선호가 아니라 시간 병진 불변성(time-translation invariance)의 직접적인 결과입니다. 세션이 지속될 수 없기 때문에, 세션 간의 일관성은 유일한 영구 계층인 파일 시스템에 의해서만 보장될 수 있기 때문입니다. ("시간 병진 불변성"은 물리학의 뇌터의 정리(Noether's theorem)에서 빌려온 개념으로, 여기서는 에이전트의 작동 여부나 시점에 관계없이 시스템의 동작이 변하지 않음을 의미합니다.)

RMSP와 AGE는 근본적으로 동일한 시간 구조 (time structure)를 마주하고 있지 않습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0