신념 인식 메모리 (Belief-Aware Memory): 에이전트에게 언제 기록을 멈춰야 하는지 가르치기

자기 개선형 메모리 루프 (self-improving memory loop)는 올바른 내용을 오래된 정보로 다시 쓰는 것을 목격하기 전까지는 분명한 승리처럼 들립니다. 에이전트가 사실을 기억했습니다. 당신은 그것을 확인했습니다. 하지만 이후에 실행된 통합 패스 (consolidation pass)가 오래된 컨텍스트 윈도우 (context window)를 대상으로 실행되어, 해당 메모리가 부정확하다고 판단하고 더 약한 버전으로 교체해 버렸습니다. 원래의 것이 더 나았습니다. 당신은 손해를 보았습니다.

이것이 바로 신념 인식 메모리 (belief-aware memory)가 방지하기 위해 구축된 실패 모드 (failure mode)입니다. "에이전트가 틀린 것을 쓴다"는 것이 아닙니다 — 그것은 모델 품질 (model quality)의 문제입니다. 구체적인 실패는 다음과 같습니다: 감독 없이 실행되는 개선 루프 (improve loop)가 그대로 두었어야 할 올바른 콘텐츠를 덮어쓰는 것입니다. 자신의 최선의 결과물을 스스로 저하시킬 수 있는 루프는 루프가 아예 없는 것보다 더 나쁩니다.

akm 0.8.0 버전은 메모리 에셋 (memory assets)의 일급 프론트매터 (frontmatter) 필드로 captureMode와 beliefState를 제공합니다. 이 두 필드는 함께 통합 패스 (consolidation pass)에 각 메모리가 무엇인지, 에이전트가 그것에 대해 무엇을 믿고 있는지, 그리고 다시 쓰기에 적합한지 여부를 알려줍니다.

두 가지 캡처 모드 (Capture Modes)

이제 모든 메모리 에셋은 captureMode 필드를 가집니다. 여기에는 두 가지 값이 있습니다.

hot은 메모리가 작성되었거나 인간에 의해 명시적으로 확인되었음을 의미합니다. 개선 루프 (improve loop)는 hot 메모리를 읽기 전용 (read-only)으로 취급합니다. 통합 계획 (consolidation plan), 병합 제안 (merge proposal), 재작성 (rewrite)이 발생하지 않습니다. 만약 청크 (chunk) 내의 모든 메모리가 captureMode: hot이라면, 통합 패스는 해당 청크에 대한 LLM 호출을 완전히 건너뜁니다 — 단 하나의 토큰도 소비되기 전에 해당 청크는 judgedNoAction으로 계산됩니다. 이것이 바로 '올-핫 청크 조기 종료 (all-hot chunk early-exit)'입니다.

background는 메모리가 에이전트에 의해 생성되었음을 의미합니다 — 즉, 이전 통합 실행 중에 승격되었거나, 추론 패스 (inference pass)에 의해 작성되었거나, 명시적인 인간의 검토 없이 akm remember에 의해 생성된 경우입니다. background 메모리는 개선 (improvement) 대상이 될 수 있습니다. 통합 패스는 병합 (merges), 재작성 (rewrites), 삭제 (deletions) 또는 업그레이드 (upgrades)를 제안할 수 있습니다.

captureMode가 설정되지 않은 경우, 해당 메모리는 통합 대상(eligible for consolidation)으로 취급됩니다. 0.8.0 버전 이전에 존재했던 메모리들은 처음 마주했을 때 이 방식으로 처리됩니다.

---
captureMode: hot
beliefState: asserted
...

---
captureMode: background
beliefState: active
...

이러한 구분은 정확하면서도 안정적인 메모리, 즉 아키텍처 결정(architectural decisions), 확인된 설정 사실(confirmed configuration facts), 검증된 벤치마크(verified benchmarks)와 같은 경우에 가장 중요합니다. 이러한 정보는 한 번 작성하여 hot으로 표시해 두면, 개선 루프(improve loop)가 더 이상 이를 건드리지 않습니다.

신념 상태 (The Belief States)

beliefState는 메모리의 정확성에 대한 에이전트의 현재 신념을 설명합니다. 이 필드는 아카이브되지 않는 다섯 가지 값을 가집니다.

active는 beliefState가 설정되지 않았을 때의 기본값입니다. 해당 메모리는 현재 사실이라고 믿어지는 상태입니다. 통합 패스(consolidation pass)는 captureMode에 따라 이를 정상적으로 처리합니다.

asserted는 active의 인간 권위(human-authority) 변형입니다. 개선 루프(improve loop)는 사용자가 akm remember를 명시적으로 사용할 때 이 값을 설정합니다. active와 마찬가지로 통합 패스는 captureMode에 따라 이를 처리 대상(eligible)으로 간주하지만, asserted는 통합 과정에서 active로 자동 강등되지 않습니다. 이는 인간이 이 메모리를 직접 다루었다는 더 강력한 신호를 전달합니다.

deprecated는 해당 메모리가 대체되었음을 의미합니다. 콘텐츠가 더 이상 현재의 최선인 표현은 아니지만, 틀린 것도 아닙니다. 즉, 과거에는 사실이었으나 이후 진화한 무언가를 설명하고 있는 상태입니다. deprecated된 메모리는 동결된 역사적 상태(frozen historical state)이며, 통합 패스는 이를 active로 갱신하지 않지만, 더 최신의 메모리로 병합(merge)될 후보가 됩니다.

superseded는 deprecated에 대응하는 시스템 할당 값입니다. 개선 루프(improve loop)는 특정 메모리가 더 새로운 메모리에 의해 교체되었다고 판단할 때 이 값을 기록합니다. deprecated와 달리, superseded는 대체했던 메모리가 나중에 철회(retracted)될 경우 다시 갱신될 수 있습니다.

contradicted는 해당 메모리가 틀린 것으로 알려졌음을 의미합니다. 이는 에이전트가 현재 더 강력하게 믿고 있는 저장소(stash) 내의 다른 정보와 충돌합니다. contradicted된 메모리는 절대 승격(promoted)되지 않으며, 기본(primary) 메모리로 병합되지도 않습니다. 또한 해당 메모리를 다루는 다음 통합 패스에서 삭제 대기열(queued for deletion)에 오르게 됩니다.

---
captureMode: background
beliefState: contradicted
...

contradictedBy 필드는 이 메모리를 대체하는 메모리들, 즉 참조(refs)의 배열입니다. 이는 수정 사항을 명시적으로 체이닝(chaining)합니다. 체인을 역방도로 읽을 수 있습니다. 각 contradictedBy 참조를 따라가면 현재의 신념(belief)을 찾을 수 있습니다. beliefState 필드는 프론트매터(frontmatter) 태그로 인덱싱되므로, akm search "beliefState:contradicted" 또는 akm search "beliefState:deprecated"를 통해 에이전트가 현재 틀렸거나 오래되었다고 믿는 모든 내용을 찾아낼 수 있습니다. 이는 긴 세션 전에 오래된 콘텐츠를 감사(auditing)할 때 유용합니다.

Improve 루프가 실제로 확인하는 것

akm improve가 통합 청크(consolidation chunk)를 시작할 때, LLM 호출을 하기 전에 captureMode를 평가합니다. 순서는 다음과 같습니다:

해당 청크의 메모리 풀(memory pool)을 로드합니다.
청크 내의 모든 메모리에 대해 captureMode를 확인합니다.
모든 메모리가 hot 상태라면, 해당 청크를 judgedNoAction으로 기록하고 다음 청크로 넘어갑니다. 모델 호출은 발생하지 않습니다.
만약 어떤 메모리라도 background 상태이거나(또는 captureMode가 설정되어 있지 않다면), LLM 통합 프롬프트(consolidation prompt)로 진행합니다. 단, 모델이 무엇을 다루고 있는지 알 수 있도록 각 메모리와 함께 신념 상태(belief state) 메타데이터를 전달합니다.
모델은 메모리에서 beliefState: contradicted를 확인하면 이를 병합의 주체(merge primary)로 사용하지 않아야 함을 인지합니다. beliefState: deprecated를 확인하면 해당 메모리를 보존해야 할 독립적인 항목이 아닌 병합 후보(merge candidate)로 취급합니다.

모든 메모리가 hot인 청크에서 조기 종료(early-exit)하는 것은 실제 환경에서 실질적인 비용 절감을 가져옵니다. 영구적으로 확정된 메모리의 대다수가 hot으로 표시된 저장소(stash)의 경우, 모델을 전혀 사용하지 않고도 상당한 비율의 청크를 건너뛸 수 있습니다. 건너뛴 청크들도 실행 텔레메트리(telemetry)의 judgedNoAction 카운터에 집계되므로, akm health를 통해 신념 상태를 통해 처리되지 않고 우회된 작업의 비율을 확인할 수 있습니다.

신념 인식 메모리 (Belief-Aware Memory) 활성화하기

Belief-aware memory는 0.8.0 버전부터 기본적으로 활성화됩니다. 대부분의 설정에서는 업그레이드 시 변경 사항이 없습니다. captureMode 필드가 없는 기존 메모리는 통합 (consolidation) 대상이 될 수 있는 것으로 간주되며, beliefState 필드가 없는 기존 메모리는 active로 해결됩니다. 이 두 가지 모두 이전의 동작 방식과 일치합니다.

memory.belief_aware 설정 플래그(기본적으로 활성화되어 있으며, akm config list에는 나타나지 않음 — 토글이 필요한 경우 릴리스 노트를 확인하세요) (릴리스 노트에 문서화됨)는 쓰기 전 검증 (pre-write validation) 경로를 제어합니다. 이 설정을 켜두는 것이 올바른 기본값입니다. 검증 오버헤드는 무시할 수 있는 수준입니다. 핵심은 확인된 콘텐츠가 덮어쓰여지는 것을 방지하는 것입니다.

실제 워크플로우 (The Workflow in Practice)

의도된 워크플로우는 간단합니다. 평소처럼 akm improve 또는 akm remember를 실행하세요. 개선 루프 (improve loop)가 사용자가 확인하고 잠금 (lock)을 원하는 메모리를 승격 (promote)시키면, 해당 에셋을 열고 captureMode: hot으로 설정하세요. 이것이 유일하게 요구되는 인간의 작업입니다.

# 승격된 메모리 검토
akm show memory:lm-studio-server-topology

...

저장소 (stash)에 있는 내용이 잘못되었을 때 — 즉, 변경된 구성 사실을 발견하거나 현재 하드웨어를 반영하지 못하는 벤치마크를 발견했을 때 — 이를 모순됨 (contradicted)으로 표시하고, 이를 대체한 메모리를 가리키도록 설정하세요:

---
captureMode: background
beliefState: contradicted
...

모순된 메모리는 통합 패스 (consolidation pass)가 이를 처리할 때까지 저장소에 남아 있습니다. 즉시 사라지지 않습니다. 이는 의도된 설계입니다. 신념 업데이트 (belief updates)의 체인 자체가 에이전트의 이해가 어떻게 진화했는지에 대한 기록이기 때문입니다. 현재의 신념이 안정적이라고 판단될 때, 이를 검토하고, 감사 (audit)하고, 명시적으로 삭제할 수 있습니다.

사용 중단된 (deprecated) 메모리의 경우에도 동일한 패턴이 적용되지만, 조금 더 가볍게 처리됩니다. 사용 중단된 메모리는 틀린 것이 아니라 구식 (outdated)인 것입니다. 통합 패스가 결국 이를 더 최신의 무언가로 병합할 것입니다. contradictedBy 필드가 후속 메모리를 가리키도록 설정하여 이 과정을 가속화할 수 있지만, 필수 사항은 아닙니다.

이것이 방지하는 것 (What This Protects Against)

개선 루프 (Improve loop)는 지속적이고 감독 없이 실행되기 때문에 강력합니다. 하지만 바로 그 점이 실패 모드 (failure mode)의 원인이기도 합니다. 저장소 (stash) 내의 무엇이든 변경을 제안할 수 있는 감독되지 않는 루프는, 충분한 시간과 충분한 예외 케이스 (edge cases)가 주어진다면, 건드리지 말아야 할 무언가에 대해 변경을 제안하게 될 것입니다.

핫 메모리 (Hot memories)는 면역력이 있습니다. 이들은 지속적인 유지보수가 필요하지 않습니다. 루프가 이들에게 도달하는 것이 허용되지 않으므로, 루프로부터 보호할 필요도 없습니다.

beliefState: active 또는 asserted 상태인 백그라운드 메모리 (Background memories)는 일반적인 순환 (rotation) 과정에 포함됩니다. 루프는 이들을 개선할 수 있습니다. 이것이 의도된 동작입니다. 백그라운드 메모리는 에이전트 세션 (agent sessions) 동안 축적되며 주기적인 통합 (consolidation)을 통해 이득을 얻습니다.

모순됨 (contradicted) 및 폐기됨 (deprecated) 상태는 루프가 "개선 대상"과 "현재 정답"을 혼동하지 않고 품질에 대해 추론할 수 있는 방법을 제공합니다. 백그라운드 상태의 active 메모리는 개선 대상이며 올바른 것으로 믿어집니다. 백그라운드 상태의 contradicted 메모리는 개선 대상이지만 틀린 것으로 믿어집니다. 이 경우 적절한 조치는 정교화 (refinement)가 아니라 삭제 (deletion) 또는 흡수 (absorption)입니다.

두 가지 캡처 모드 (capture modes), 다섯 가지 신념 상태 (belief states), 그리고 명시적인 모순 체인 (contradiction chain)의 조합은 루프가 수행하는 작업에 대해 세밀한 제어 (fine-grained control)를 가능하게 합니다. 루프가 무엇을 개선해야 하고 무엇을 그대로 두어야 하는지를 구별할 수 있는 충분한 정보를 갖게 될 때, 루프는 부채 (liability)가 아닌 자산 (asset)이 됩니다.

신념 인식 메모리 (Belief-aware memory)는 akm 0.8.0의 일부입니다. 전체 필드 참조는 docs/configuration.md에서 확인할 수 있습니다. 개선 파이프라인 (improve pipeline) 및 통합 패스 (consolidation pass) 동작은 improve pipeline debugging post와 0.8.0 release notes에서 다루고 있습니다. 개선 루프 (improve loop) 설정 및 스케줄링에 대한 단계별 안내는 The Improve Loop: Continuous Memory Curation을 참조하십시오.