AI 에이전트를 위한 다중 신호 메모리 아키텍처 (Multi-Signal Memory Architecture)
요약
단일 임베딩 유사도 검색의 한계를 극복하기 위한 다중 신호 메모리 아키텍처를 소개합니다. 키워드 매칭, 임베딩 유사도, 시간적 감쇠, 엔티티 그래프 재순위화의 네 가지 신호를 결합하여 에이전트의 기억 성능을 극대화하는 방법을 다룹니다.
핵심 포인트
- 단일 임베딩 검색은 문맥적 관계를 놓칠 위험이 있음
- BM25 키워드 매칭으로 정확한 용어 검색 보완
- 시간적 감쇠를 통해 최신 정보의 관련성 가중치 부여
- 엔티티 그래프 재순위화로 엔티티 간 관계 포착
- 다중 신호 결합 시 Recall@10 성능이 40-60% 향상됨
AI 에이전트를 위한 다중 신호 메모리 아키텍처 (Multi-Signal Memory Architecture)
대부분의 AI 에이전트 메모리 시스템은 단일 검색 신호인 임베딩 유사도 (embedding similarity)를 사용합니다. 쿼리를 임베딩하고, 메모리를 임베딩한 다음, 코사인 유사도 (cosine similarity)를 통해 상위 k개를 반환하는 방식입니다. 이는 단순한 사례에는 작동하지만, 수 주간의 대화에 걸친 문맥을 기억해야 하는 에이전트에게는 처참하게 실패합니다.
단일 신호 검색의 문제점
에이전트가 10,000개의 메모리를 가지고 있다고 가정해 봅시다. 사용자가 "지갑에 대해 무엇을 결정했었지?"라고 묻습니다. 임베딩 검색은 "지갑"에 관한 메모리를 반환하지만, "Colby는 모든 결제에 Base 체인을 사용하기로 결정했다"라고 적힌 메모리는 놓칠 수 있습니다. 왜냐하면 "decide"와 "wallet"의 임베딩이 "지갑에 대해 무엇을 결정했었지"라는 문장과 강력하게 일치하지 않을 수 있기 때문입니다.
네 가지 신호
Norax는 학습된 가중치와 결합된 네 가지 검색 신호를 사용합니다:
1. 키워드 매칭 (Keyword Matching, BM25)
빠르고 정확한 용어 매칭입니다. 사용자가 "TypeORM"이라고 말하면, 의미적으로 유사하지만 다른 단어를 사용하는 메모리가 아니라 "TypeORM"을 포함하는 메모리를 원하게 됩니다.
2. 임베딩 유사도 (Embedding Similarity)
밀집 벡터 유사도 (Dense vector similarity)는 의미론적 관계를 포착합니다. "Crypto wallet"은 단어가 겹치지 않더라도 "EVM address on Base"와 매칭되어야 합니다.
3. 시간적 감쇠 (Temporal Decay)
최근의 메모리가 관련성이 높을 가능성이 큽니다. 2시간 전의 메모리는 가산점을 받고, 3개월 전의 메모리는 감점을 받습니다. 감쇠율 (decay rate)은 메모리 종류별로 설정할 수 있습니다. 예를 들어, 절차적 메모리 (procedural memories)는 스크래치패드 (scratchpad) 항목보다 더 느리게 감쇠합니다.
4. 엔티티 그래프 재순위화 (Entity Graph Reranking)
처음 세 가지 신호가 후보군을 생성한 후, 엔티티 중복 (entity overlap)을 기반으로 재순위화 (rerank)를 수행합니다. 쿼리에 "Colby"와 "wallet"이 언급되면, 두 엔티티를 모두 포함하는 메모리가 가산점을 받습니다. 이는 엔티티가 노드(node)가 되고 공생 (co-occurrence)이 엣지(edge)를 생성하는 커뮤니티 탐지 그래프 (community-detected graph)로 구현됩니다.
신호 결합하기
def combine_signals(query, candidates, entities):
for item in candidates:
# 각 신호를 [0, 1]로 정규화
...
결과
실제로, 다중 신호 검색 (multi-signal retrieval)은 에이전트 메모리 워크로드의 recall@10 성능에서 단일 신호 검색보다 40-60% 더 뛰어난 성능을 보입니다. 가장 큰 성과는 엔티티 그래프 재순위화 (entity graph reranking)에서 나타나는데, 이는 임베딩 유사도 (embedding similarity)만으로는 놓칠 수 있는 관계들을 포착해냅니다.
결론
AI 에이전트를 구축하고 있다면, 임베딩 유사도 (embedding similarity)에만 의존하지 마세요. 정밀도를 위한 키워드 매칭 (keyword matching), 최신성을 위한 시간적 감쇠 (temporal decay), 그리고 관계 인식을 위한 엔티티 그래프 (entity graphs)를 추가하세요. 이들의 조합은 그 어떤 단일 신호보다 훨씬 더 효과적입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기