본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 30. 12:28

EVAF: 선택적 파라미터 통합 (Selective Parametric Consolidation)을 위한 검사-재검사 프로토콜

요약

언어 에이전트의 경험을 모델 파라미터에 선택적으로 통합하는 EVAF 메커니즘과 이를 검증하기 위한 검사-재검사 프로토콜을 제안합니다. 실험 결과, EVAF는 사실적 기억을 보존하면서도 가치 있고 놀라운 경험을 우선적으로 내재화하여 행동 지속성을 높였습니다.

핵심 포인트

  • EVAF 메커니즘을 통한 선택적 파라미터 통합 기술 제안
  • 검색 가능한 사실적 기억과 내재화된 경험의 분리 구현
  • 파라미터 드리프트 및 교차 페르소나 오염 최소화
  • 기존 베이스라인 대비 강력한 행동 지속성 입증

장기 실행되는 언어 에이전트 (Language Agents)는 작업 컨텍스트 (Working Context)가 사라진 후 어떤 경험이 지속되어야 하는지를 결정하는 메커니즘이 필요합니다. 검색 시스템 (Retrieval Systems)은 과거의 텍스트를 다시 삽입할 수 있지만, 검색 시스템 그 자체만으로는 특정 경험이 모델 자체의 행동으로 선택적으로 통합 (Consolidated)되었음을 보여주지는 못합니다. 우리는 게이트형 LoRA 통합 (Gated LoRA Consolidation)을 위한 Echo-Valence Attractor Field 메커니즘인 EVAF와, 통제된 간섭 (Interference) 하에서 선택적 파라미터 통합 (Selective Parametric Consolidation)을 측정하기 위한 검사-재검사 (Test-retest) 프로토콜을 소개합니다. GPT-2 및 TinyLlama를 대상으로 실험한 결과, EVAF는 상호 보완적인 라우팅된 메모리 경로 (Routed Memory Path)를 통해 검색 가능한 사실적 기억 (Factual Memory)을 보존하면서도, 높은 가치 (High-valence)와 높은 놀라움 (High-surprise)을 가진 경험을 우선적으로 통합합니다. 검사-재검사 측정 결과, EVAF는 파라미터 드리프트 (Parameter Drift)와 교차 페르소나 오염 (Cross-persona Contamination)을 낮게 유지하면서도, 동결된 (Frozen), 검색 전용 (Retrieval-only), 그리고 게이트가 없는 지속적 업데이트 (Ungated Continual-update) 베이스라인 모델들보다 간섭 이후 더 강력한 행동 지속성을 보여주었습니다. 이러한 결과는 메모리 접근 (Memory Access)과 메모리 깊이 (Memory Depth) 사이의 분리를 뒷받침합니다. 즉, 사실을 검색하는 것과 경험을 내재화하는 것은 서로 다른 계산 작업 (Computational Operations)입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0