MemRefine: 장기 에이전트 메모리를 위한 LLM 기반 압축 기법
요약
MemRefine은 장기 상호작용에서 발생하는 대규모 언어 모델(LLM) 에이전트의 메모리 관리 문제를 해결하기 위해 제안된 기법입니다. 이 방법은 단순히 표면적 유사성 대신, 사실적 가치를 기반으로 LLM 심사위원이 삭제, 병합, 보존 결정을 내립니다. 이를 통해 제한된 저장 예산 내에서 유용한 정보를 효과적으로 유지하며 성능을 향상시킵니다.
핵심 포인트
- 장기 에이전트 메모리 관리는 정보 과부하 및 비용 증가 문제를 야기합니다.
- MemRefine은 표면적 유사성 대신 사실적 가치를 기반으로 메모리를 관리합니다.
- LLM 심사위원이 삭제, 병합, 보존 결정을 내리며 예산 제약을 충족시킵니다.
- 다양한 벤치마크에서 규칙 기반 모델보다 우수한 성능을 입증했습니다.
대규모 언어 모델(LLM) 에이전트는 과거 대화의 정보가 미래 작업을 지원하기 위해 보존되고 회상되어야 하는 장기간 상호작용을 수행하도록 요구받고 있습니다. 그러나 상호작용이 축적됨에 따라 메모리 저장소는 무한히 커지고, 중복된 항목들로 가득 차서 저장 비용을 증가시키고 가장 유용한 증거들을 밀어내 검색 성능을 저하시킵니다. 더욱이 이는 하드웨어 메모리 예산과 같은 제약이 있는 플랫폼에서 특히 제한적이며, 저희에게는 이미 구축된 메모리 저장소를 고정된 예산 내에 유지하면서 미래 상호작용에 유용한 정보를 보존하는 '저장 예산 기반 메모리 관리'를 공식화하도록 동기를 부여했습니다. 이를 위해, 우리는 MemRefine을 제안합니다. 이는 표면적 유사성(surface similarity)이 사실적 가치(factual value)를 제대로 반영하지 못한다는 점에 착안하여, 유사성은 단지 후보 쌍을 제안하는 데만 사용하고, 삭제(delete), 병합(merge), 보존(preserve) 결정은 사실적 내용을 기반으로 하는 LLM 심사위원(LLM judge)에게 맡기며, 예산이 충족될 때까지 반복합니다. 여러 메모리 프레임워크와 장기 대화 벤치마크 전반에 걸쳐, MemRefine은 목표 예산을 일관되게 충족시키면서 다운스트림 성능을 보존하고, 빠듯한 예산 조건 하에서 규칙 기반 기준 모델(rule-based baselines)보다 우수한 성능을 보였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기