arXiv논문2026. 05. 22. 11:28

MOSS: 자율 에이전트 시스템에서의 소스 레벨 재작성을 통한 자기 진화 (Self-Evolution)

요약

MOSS는 텍스트 기반의 기존 자기 진화 에이전트 한계를 넘어, 소스 코드 레벨에서 직접 재작성을 수행하는 자율 에이전트 시스템입니다. 운영 중 발생하는 구조적 실패를 해결하기 위해 결정론적 파이프라인과 외부 코딩 에이전트를 활용하여 에이전트의 성능을 스스로 개선합니다.

핵심 포인트

텍스트 수정을 넘어 소스 코드 레벨의 자기 재작성 구현
결정론적 다단계 파이프라인을 통한 코드 수정 및 검증
실패 증거 기반의 자동화된 성능 개선 사이클
OpenClaw 환경에서 작업 등급 점수를 0.25에서 0.61로 향상

자율 에이전트 시스템 (Autonomous agentic systems)은 배포 후 대체로 정적인 상태를 유지합니다. 즉, 사용자 상호작용으로부터 학습하지 않으며, 반복되는 실패는 인간이 주도하는 다음 업데이트가 수정 사항을 배포할 때까지 지속됩니다. 이에 대한 대응으로 자기 진화형 에이전트 (Self-evolving agents)가 등장했지만, 이들은 모두 진화의 범위를 텍스트로 수정 가능한 산출물(text-mutable artifacts) — 기술 파일 (skill files), 프롬프트 설정 (prompt configurations), 메모리 스키마 (memory schemas), 워크플로 그래프 (workflow graphs) — 에 국한시키며 에이전트 하네스 (agent harness)는 건드리지 않은 채로 둡니다. 라우팅 (routing), 훅 순서 (hook ordering), 상태 불변성 (state invariants), 디스패치 (dispatch)는 텍스트 산출물이 아닌 코드 내에 존재하기 때문에, 구조적 실패 (structural failure)라는 특정 범주는 텍스트 계층으로부터 물리적으로 접근이 불가능합니다.

우리는 소스 레벨 적응 (source-level adaptation)이 근본적으로 더 일반적인 매체라고 주장합니다. 이는 튜링 완전 (Turing-complete)하며, 모든 텍스트 수정 가능 범위의 엄격한 상위 집합(strict superset)이고, 기본 모델의 준수 여부가 아닌 결정론적 (deterministic) 방식으로 효과를 발휘하며, 긴 문맥 드리프트 (long-context drift) 하에서도 침식되지 않습니다. 우리는 실제 운영 중인 에이전트 기질 (agentic substrates)에서 소스 레벨의 자기 재작성 (self-rewriting)을 수행하는 시스템인 MOSS를 제시합니다. 각 진화는 자동으로 큐레이션된 운영 실패 증거 (production-failure evidence) 배치에 고정되며, 결정론적인 다단계 파이프라인을 통해 진행됩니다. 코드 수정은 플러그형 외부 코딩 에이전트 CLI (external coding-agent CLI)에 위임되는 반면, MOSS는 단계 순서와 판결 (verdicts)을 유지합니다. 후보안은 일시적인 시험 워커 (ephemeral trial workers)에서 후보 이미지에 대해 배치를 재실행함으로써 검증되며, 그 후 사용자 동의를 거치는 인플레이스 컨테이너 스왑 (in-place container swap)과 상태 확인 프로브 (health-probe) 기반의 롤백 (rollback)을 통해 승격됩니다. OpenClaw에서 MOSS는 인간의 개입 없이 단 한 번의 사이클만으로 4개 작업 평균 등급 점수 (mean grader score)를 0.25에서 0.61로 끌어올렸습니다.

AI 자동 생성 콘텐츠

원문 바로가기

MOSS: 자율 에이전트 시스템에서의 소스 레벨 재작성을 통한 자기 진화 (Self-Evolution)

요약

핵심 포인트

댓글