AutoMem: 인지 기술로서의 메모리 자동 학습

메모리 전문성은 학습된 기술입니다. 무엇을 인코딩(encode)할지, 언제 검색(retrieve)할지, 그리고 지식을 어떻게 조직화할지를 아는 능력이며, 이는 인지 과학에서 메타메모리 (metamemory)라고 알려진 역량입니다. 우리는 메모리 관리를 학습 가능한 기술로 취급함으로써 이러한 관점을 LLM (Large Language Models)에 도입합니다. 우리는 파일 시스템 연산 (file-system operations)을 작업 액션 (task actions)과 함께 일급 메모리 액션 (first-class memory actions)으로 격상시켜, 모델 스스로가 자신의 메모리를 어떻게 관리할지 결정하게 합니다. 이 메모리 기술은 두 가지 축을 따라 향상됩니다: 이를 지원하는 구조(프롬프트, 파일 스키마, 액션 어휘)와 이를 실행하는 모델의 숙련도입니다. 두 축 모두 수동 최적화가 어렵습니다. 장기적 과업 (long-horizon tasks)의 에피소드는 수천 단계에 걸쳐 실행되며, 단 한 번의 메모리 실수가 표면화되기 훨씬 전에 숨겨질 수 있어 전체 궤적 (trajectories)에 대한 인간의 검토는 비실용적입니다. 우리는 이 두 축을 모두 자동화하는 프레임워크인 AutoMem을 소개합니다. 첫 번째 루프에서는 강력한 LLM이 완전한 에이전트 궤적을 검토하고, 에이전트가 메모리 파일과 상호작용하는 방식을 형성하는 메모리 구조를 반복적으로 수정합니다. 두 번째 루프에서는 많은 에피소드로부터 에이전트 자신의 우수한 메모리 결정들을 식별하여, 모델의 메모리 숙련도를 직접적으로 날카롭게 만드는 학습 신호 (training signal)로 사용합니다. 세 가지 절차적으로 생성된 장기적 게임 (Crafter, MiniHack, NetHack)에서 모델의 작업 액션 동작을 수정하지 않고 메모리만을 최적화했을 때, 기본 에이전트의 성능이 약 2배에서 4배 향상되었으며, 32B 오픈 웨이트 (open-weight) 모델을 Claude Opus 4.5 및 Gemini 3.1 Pro Thinking과 같은 프런티어 시스템 (frontier systems)과 경쟁할 수 있는 수준으로 끌어올렸습니다. 우리의 결과는 메모리 관리가 독립적으로 학습 가능한 기술이며, 장기적 과업에서 큰 이득을 가져다주는 영향력 높은 목표 (high-leverage objective)임을 보여줍니다.

Insights

AutoMem: 인지 기술로서의 메모리 자동 학습

요약

핵심 포인트

댓글

엔비디아가 오픈소스 모델 네모트론을 통째로 얹기로 한 플랫폼이 팔란티어다. 발표 후 팔란티어는 하루 7.7% 뛰었다. 왜 하필 여기였을까.

시장가의 3.6배. 위메이드 창업자 지분 39.33%에 중국계 자본이 쳐준 값이다. 종가 1만9330원짜리 주식을 주당 6만8910원, 총

구글이 제미나이 개인화 이미지 생성을 미국 무료 사용자 전원에게 풀었다. 유료 구독자 전용이던 기능인데, 왜 갑자기 공짜가 됐을까.

이것은 정말 AI가 생성한 것 같지 않네요, 너무 사실적입니다!!

엔비디아가 오픈소스 모델 네모트론을 통째로 얹기로 한 플랫폼이 팔란티어다. 발표 후 팔란티어는 하루 7.7% 뛰었다. 왜 하필 여기였을까.

시장가의 3.6배. 위메이드 창업자 지분 39.33%에 중국계 자본이 쳐준 값이다. 종가 1만9330원짜리 주식을 주당 6만8910원, 총

구글이 제미나이 개인화 이미지 생성을 미국 무료 사용자 전원에게 풀었다. 유료 구독자 전용이던 기능인데, 왜 갑자기 공짜가 됐을까.

이것은 정말 AI가 생성한 것 같지 않네요, 너무 사실적입니다!!