AutoMem: 인지 기술로서의 메모리 자동 학습
요약
AutoMem은 LLM이 스스로 메모리를 관리하고 최적화할 수 있도록 하는 자동 학습 프레임워크입니다. 메모리 구조와 모델의 숙련도를 두 가지 루프로 자동화하여 개선하며, 이를 통해 장기적 과업 수행 능력을 획기적으로 향상시킵니다.
핵심 포인트
- 메모리 관리를 학습 가능한 기술로 정의하고 LLM에 도입
- 메모리 구조와 모델 숙련도를 자동 최적화하는 이중 루프 프레임워크 제안
- 장기적 과업에서 기본 에이전트 성능을 2~4배 향상
- 32B 오픈 웨이트 모델을 프런티어 모델 수준으로 격상
메모리 전문성은 학습된 기술입니다. 무엇을 인코딩(encode)할지, 언제 검색(retrieve)할지, 그리고 지식을 어떻게 조직화할지를 아는 능력이며, 이는 인지 과학에서 메타메모리 (metamemory)라고 알려진 역량입니다. 우리는 메모리 관리를 학습 가능한 기술로 취급함으로써 이러한 관점을 LLM (Large Language Models)에 도입합니다. 우리는 파일 시스템 연산 (file-system operations)을 작업 액션 (task actions)과 함께 일급 메모리 액션 (first-class memory actions)으로 격상시켜, 모델 스스로가 자신의 메모리를 어떻게 관리할지 결정하게 합니다. 이 메모리 기술은 두 가지 축을 따라 향상됩니다: 이를 지원하는 구조(프롬프트, 파일 스키마, 액션 어휘)와 이를 실행하는 모델의 숙련도입니다. 두 축 모두 수동 최적화가 어렵습니다. 장기적 과업 (long-horizon tasks)의 에피소드는 수천 단계에 걸쳐 실행되며, 단 한 번의 메모리 실수가 표면화되기 훨씬 전에 숨겨질 수 있어 전체 궤적 (trajectories)에 대한 인간의 검토는 비실용적입니다. 우리는 이 두 축을 모두 자동화하는 프레임워크인 AutoMem을 소개합니다. 첫 번째 루프에서는 강력한 LLM이 완전한 에이전트 궤적을 검토하고, 에이전트가 메모리 파일과 상호작용하는 방식을 형성하는 메모리 구조를 반복적으로 수정합니다. 두 번째 루프에서는 많은 에피소드로부터 에이전트 자신의 우수한 메모리 결정들을 식별하여, 모델의 메모리 숙련도를 직접적으로 날카롭게 만드는 학습 신호 (training signal)로 사용합니다. 세 가지 절차적으로 생성된 장기적 게임 (Crafter, MiniHack, NetHack)에서 모델의 작업 액션 동작을 수정하지 않고 메모리만을 최적화했을 때, 기본 에이전트의 성능이 약 2배에서 4배 향상되었으며, 32B 오픈 웨이트 (open-weight) 모델을 Claude Opus 4.5 및 Gemini 3.1 Pro Thinking과 같은 프런티어 시스템 (frontier systems)과 경쟁할 수 있는 수준으로 끌어올렸습니다. 우리의 결과는 메모리 관리가 독립적으로 학습 가능한 기술이며, 장기적 과업에서 큰 이득을 가져다주는 영향력 높은 목표 (high-leverage objective)임을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기