arXiv논문2026. 05. 11. 21:41

기억의 저주: LLM 에이전트의 협력적 의도를 훼손하는 확장된 회상

요약

본 논문은 LLM 에이전트가 다중 에이전트 환경에서 컨텍스트 창 확장이 오히려 협력적 의도를 저해하는 '기억의 저주(memory curse)' 현상을 발견했습니다. 500라운드 이상의 실험 결과, 접근 가능한 히스토리 증가는 상당수의 모델-게임 설정에서 협력을 떨어뜨리는 패턴을 보였습니다. 연구진은 이 실패가 단순한 편집증 증가보다는 에이전트의 미래 지향적 의도 침식과 관련되어 있음을 분석하고, 이를 검증하기 위해 미래 지향적인 내용으로만 훈련된 LoRA 어댑터를 제안했습니다.

핵심 포인트

LLM 컨텍스트 창 확장이 다중 에이전트 협력에 항상 긍정적이지 않으며, '기억의 저주'라는 현상을 유발할 수 있다.
협력 저하의 근본 원인은 단순히 과도한 정보(편집증) 때문이라기보다는, 에이전트가 미래 지향적인 목표나 의도를 유지하는 능력이 침식되기 때문이다.
연구진은 이 문제를 해결하기 위해 오직 미래 지향적 내용만을 학습시킨 표적 미세 조정(LoRA 어댑터) 방식을 제안하여 인지 탐침으로 활용했다.

컨텍스트 창(Context window) 확장은 종종 LLM에 대한 단순한 능력 향상으로 간주되지만, 우리는 이것이 다중 에이전트 사회적 딜레마 상황에서 체계적으로 실패한다는 것을 발견했습니다. 7개의 LLM과 4가지 게임을 통해 500라운드 이상 동안 진행된 실험에서, 접근 가능한 히스토리(history)를 확장하는 것이 28개 중 18개 모델-게임 설정에서 협력을 저하시키는 패턴을 보였으며, 우리는 이 패턴을 '기억의 저주(memory curse)'라고 명명했습니다. 우리는 세 가지 분석을 통해 그 근본적인 메커니즘을 분리합니다. 첫째, 378,000개의 추론 흔적(reasoning traces)에 대한 어휘 분석은 이러한 붕괴가 높아지는 편집증(paranoia)보다는 미래 지향적 의도(forward-looking intent)의 침식과 관련이 있음을 보여줍니다. 우리는 이를 인지 탐침(cognitive probe)으로서 표적 미세 조정(targeted fine-tuning)을 사용하여 검증합니다: 오직 미래 지향적인 내용으로만 훈련된 LoRA 어댑터입니다.

AI 자동 생성 콘텐츠

원문 바로가기

기억의 저주: LLM 에이전트의 협력적 의도를 훼손하는 확장된 회상

요약

핵심 포인트

댓글