터미널을 닫는 순간 모든 것을 잊어버리는 AI 코딩 에이전트를 위한 해결책

요약

AI 코딩 에이전트의 단기 기억 문제를 해결하기 위해 ACL 2026에서 발표된 메모리 운영체제 EverOS를 소개합니다. 하이퍼그래프 메모리 아키텍처를 통해 세션과 프로젝트를 초월한 장기 기억을 제공하며, 소형 모델의 성능을 극대화합니다.

핵심 포인트

하이퍼그래프 기반의 HyperMem 아키텍처로 고도화된 메모리 계층 제공
표준 RAG 대비 장기 대화 작업 재현율을 93% 이상으로 향상
Markdown 기반의 로컬 우선 스택으로 데이터 가독성 및 버전 관리 지원
기술 자기 진화 전략을 통해 소형 모델의 작업 성공률을 대폭 개선

당신의 AI 코딩 에이전트는 터미널을 닫는 순간 모든 것을 잊어버립니다. 모든 대화, 모든 결정, 모든 버그 수정까지 전부 사라집니다. 당신은 매일 아침 코드베이스 전체를 다시 설명해야 합니다.

누군가 이 문제를 해결하는 메모리 운영체제 (memory operating system)를 만들었습니다. ACL 2026에서 발표되었으며, GitHub 스타 7,200개를 기록했습니다.

그것의 이름은 EverOS입니다.

벡터 데이터베이스 (vector database)가 아닙니다. 더 나은 프롬프트를 사용한 RAG (Retrieval-Augmented Generation)도 아닙니다. AI 에이전트 하단에 위치하여 세션, 날짜, 프로젝트를 초월해 기억하게 만드는 실제 메모리 계층 (memory layer)입니다.

당신의 에이전트는 지난 화요일에 무엇을 시도했는지 기억합니다. 왜 작동하지 않았는지 기억합니다. 다시 말해주지 않아도 당신의 코드 스타일 선호도를 기억합니다. 지난달에 내린 모든 아키텍처 결정 (architectural decision)을 기억합니다.

작동 방식은 다음과 같습니다:

→ 설치를 위한 세 가지 명령: pip install everos → everos init → everos server start
→ 이중 트랙 메모리 (Dual-track memory) — 에이전트 메모리 (사례, 기술)와 사용자 메모리 (에피소드, 프로필)를 독립적으로 추출
→ 모든 메모리는 Markdown 파일로 저장 — 읽기 가능, 편집 가능, grep 가능, Git 버전 관리 가능, Obsidian에서 열기 가능
→ 로컬 우선 스택 (Local-first stack): Markdown + SQLite + LanceDB — MongoDB, Elasticsearch, Redis 사용 안 함
→ 하이브리드 검색 (Hybrid retrieval): 밀집 의미론적 벡터 (dense semantic vectors) + 희소 키워드 매칭 (sparse keyword matching) + 멀티모달 정렬 (multimodal alignment)
→ 멀티모달 인제스션 (Multimodal ingestion) — 텍스트, 이미지, 오디오, 문서, URL을 기억
→ 기술 진화 엔진 (Skills Evolution Engine) — 에이전트가 과거 상호작용으로부터 재사용 가능한 기술을 자동으로 추출
→ 25개 이상의 실행 가능한 유스케이스 (use cases) 포함 — 코딩 오케스트레이션부터 알츠하이머 기억 보조, AI 웨어러블 통합까지

기술적으로 차별화되는 점은 다음과 같습니다:

대부분의 "메모리" 솔루션은 시스템 프롬프트가 포함된 벡터 데이터베이스입니다. 채팅 기록을 검색하고, 올바른 청크 (chunk)가 돌아오기를 바라며, 임베딩 (embedding)이 올바른 문맥을 포착하기를 기도해야 합니다.

EverOS는 ACL 2026에 채택된 하이퍼그래프 메모리 아키텍처 (hypergraph memory architecture)인 HyperMem을 사용합니다. 평면적인 벡터 조회 (flat vector lookups) 대신, 메모리를 주제 (topic), 에피소드 (episode), 사실 (fact) 계층으로 구성합니다. 하나의 하이퍼엣지 (hyperedge)가 여러 노드 (node)를 연결합니다. 구조 내에 시계열적 연관성 (cross-time associations)과 멀티홉 추론 (multi-hop reasoning)이 내장되어 있습니다.

그 결과: 표준 RAG가 약 45%에 그치는 장기 대화 작업 (long-term conversational tasks)에서 93% 이상의 재현율 (recall)을 기록했습니다.

가장 놀라운 부분은 다음과 같습니다:

그들의 벤치마크에 따르면, 27B 파라미터 모델에 기술 자기 진화 (Skills self-evolution) 전략을 추가했을 때 작업 성공률이 234.8% 증가하여, 397B 모델의 성능과 맞먹는 결과를 보여주었습니다.

메모리를 갖춘 작은 모델이 메모리가 없는 모델보다 15배 더 큰 모델의 성능을 능가한 것입니다.

이것이 바로 메모리를 단순한 기능 (feature)이 아닌 인프라 (infrastructure)로 보아야 한다는 근거입니다.

Claude Code, Codex, OpenClaw, Hermes, 그리고 API 호출이 가능한 모든 에이전트와 함께 작동합니다. Apache 2.0 라이선스 (License).

GitHub 스타 7.2K개. 포크 (forks) 714개. 연구 기반. 셀프 호스팅 가능 (Self-hostable). 로컬 우선 (Local-first).

100% 오픈 소스 (Open Source).

(링크는 댓글에)
[IMG:1]

AI 자동 생성 콘텐츠

원문 바로가기