arXiv논문2026. 06. 05. 13:47

에이전트 메모리: 상태 유지형 장기 작업(Stateful Long-Horizon Workloads)의 특성 분석 및 시스템적 시사점

요약

LLM 에이전트의 장기 작업을 위한 메모리 시스템의 동작을 분석한 최초의 시스템 특성 분석 연구입니다. 에이전트 메모리 분류 체계를 제안하고, 구축·검색·생성 비용을 프로파일링하여 설계 선택이 시스템 성능에 미치는 영향을 규명합니다.

핵심 포인트

에이전트 메모리 시스템을 위한 시스템 지향적 분류 체계 도입
단계 인식 프로파일링을 통한 구축, 검색, 생성 비용 분석
10개 대표 시스템 분석을 통한 설계 선택과 비용 간의 관계 규명
스케줄링, 신선도-지연 시간 트레이드오프 등 10가지 시스템 권장 사항 제시

LLM 에이전트(LLM agents)는 긴 상호작용 이력에 걸쳐 지속적인 추론을 요구하는 장기 작업(long-horizon tasks)에 점점 더 많이 배치되고 있습니다. 이를 대규모로 실현하기 위해서는 에이전트가 세션 전반에 걸쳐 자신의 메모리를 지속적으로 저장, 검색 및 업데이트해야 합니다. 평면적 검색(flat retrieval), LLM 매개 추출(LLM-mediated extraction), 통합된 사실 저장소(consolidating fact stores), 에이전트 제어 흐름(agentic control flows)에 이르는 에이전트 메모리 시스템의 풍부한 생태계가 등장했습니다. 그러나 이들의 시스템 수준(system-level) 동작은 아직 특성화되지 않은 상태입니다. 본 논문에서는 에이전트 메모리에 대한 최초의 시스템 특성 분석(systems characterization)을 제시합니다. 첫째, 네 가지 축을 따라 에이전트 메모리 시스템을 분류하는 시스템 지향적 분류 체계(system-oriented taxonomy)를 도입합니다. 둘째, 구축(construction), 검색(retrieval), 생성(generation)에 대한 비용을 할당하는 단계 인식 프로파일링 하네스(phase-aware profiling harness)를 구축합니다. 셋째, 두 가지 벤치마크 제품군(benchmark suites)에 걸쳐 10개의 대표적인 시스템을 특성화하여, 설계 선택이 쓰기(write) 및 읽기(read) 경로 전반에서 비용을 어떻게 변화시키는지 밝혀냅니다. 마지막으로, 구축 스케줄링(construction scheduling), 역량 하한선(capability floors), 쿼리 볼륨을 통한 비용 분할(amortization via query volume), 신선도-지연 시간 트레이드오프(freshness-latency tradeoffs), 그리고 플릿 규모 관리(fleet-scale management)를 다루는 10가지 시스템 권장 사항을 도출합니다.

AI 자동 생성 콘텐츠

원문 바로가기

에이전트 메모리: 상태 유지형 장기 작업(Stateful Long-Horizon Workloads)의 특성 분석 및 시스템적 시사점

요약

핵심 포인트

댓글