저는 18세이며, AI를 위한 뉴런 유사 메모리 시스템을 구축했습니다

어떻게 하면 실제로 기억하는 AI를 만들 수 있을까요?

단순히 청크(chunks)에 대한 RAG(Retrieval-Augmented Generation)가 아닙니다. 벡터 검색(vector search)도 아닙니다. 인간이 가진 것과 같은 진짜 메모리(memory) 말입니다.

그 질문이 저를 사로잡았고 놓아주지 않았습니다. 그래서 저는 해마(hippocampus), 에빙하우스 망각 곡선(Ebbinghaus forgetting curves), 상보적 학습 시스템(complementary learning systems), 서파 수면 재생(slow-wave sleep replay)에 대해 공부했습니다. 그리고 그것을 직접 구축했습니다.

아키텍처 (The Architecture)

┌──────────────────────────────────────────────────────────────┐
│ 5단계 메모리 아키텍처 (5-TIER MEMORY ARCHITECTURE) │
├──────────────────────────────────────────────────────────────┤
│ │
│ 1+2단계 에피소드 버퍼 (TIER 1+2 EPISODIC BUFFER) 뇌: 해마 (Hippocampus) │
│ ═══════════════════════════════ 속도: <1ms │
│ 64개의 작업 항목 + 256개의 에피소드 항목 │
│ 에빙하우스 감쇠 (Ebbinghaus decay): n^0.3 · e^(-λt) · 중요도 (importance) │
│ 망각 임계값 (Forget threshold): 0.05 | 승격 임계값 (Promote threshold): 0.65 │
│ 매 읽기 시 액세스 기반 강화 (Access-based reinforcement) │
│ ↓ │
│ 3단계 의미론적 저장소 (TIER 3 SEMANTIC STORE) 뇌: 신피질 (Neocortex) │
│ ═══════════════════════════════ 속도: ~50ms │
│ ChromaDB v2 · all-mpnet-base-v2 (768-dim) │
│ 하이브리드 검색 (Hybrid search): 밀집(dense) + BM25 → 상호 순위 융합 (Reciprocal Rank Fusion) │
│ ↓ │
│ 4단계 지식 그래프 (TIER 4 KNOWLEDGE GRAPH) 뇌: 연합 피질 (Association Cortex) │
│ ═══════════════════════════════ 속도: ~100ms │
│ spaCy NER + 30개 키워드 패턴 │
│ NetworkX + SQLite · 멀티홉 추론 (Multi-hop reasoning) │
│ 자동 관계 추론 (Auto-relation inference): uses/works_on/depends_on │
│ ↓ │
│ 5단계 콜드 아카이브 (TIER 5 COLD ARCHIVE) 뇌: 분산 피질 (Distributed Cortex) │
│ ═══════════════════════════════ 속도: 비동기 (async) │
│ 파일 시스템 JSON · YYYY/MM 조직화 │
│ 전체 텍스트 검색 (Full-text search) · 활성 상태로 해동 (Thaw to active) · 압축된 요약 (Compact summaries) │
│ │
├──────────────────────────────────────────────────────────────┤
│ 통합 파이프라인 (CONSOLIDATION PIPELINE) (수면 유사 기능) │
│ ═══════════════════════════════════════════════ │
│ 감쇠 (Decay) → 클러스터링 (Cluster) → 병합 (Merge(LLM)) → 재점수화 (Rescore) → 승격 (Promote) → │
│ 관계 찾기 (FindRelations(LLM)) → 아카이브 (Archive) → 신경 발생 (Neurogenesis) │
│ 퀵 모드: 60ms (5분마다) | 풀 모드: ~3s (유휴 상태 시) │
├──────────────────────────────────────────────────────────────┤
│ 대기 뉴런 에이전트 (STANDBY NEURON AGENTS) │
│ ═══════════════════════════════════════════════ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │

│ │ Personal │ │ Tech │ │ Projects │ ...N agents │
│ │ Agent │ │ Agent │ │ Agent │ │
│ │ │ │ │ │ │ │
│ │ DEEP 💤 │ │ LIGHT 🟡 │ │ DEEP 💤 │ │
│ │ 0 RAM │ │ ~3KB RAM │ │ 0 RAM │ │
│ │ 0 tokens │ │ ready │ │ 0 tokens │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │
│ Wake: 트리거 패턴 + 중심점 유사도 (centroid similarity) │
│ Vote: 모든 에이전트 점수 산출 → 상위 K개가 합의 패널 (consensus panel) 형성 │
│ Sleep: 작업 후 유휴 상태로 복귀 (토큰 소비 0) │
│ Spawn: 신경 발생 (Neurogenesis)을 통해 메모리 클러스터로부터 에이전트 생성 │
│ Prune: 비활성 에이전트는 30일 후 자동 제거 │
└──────────────────────────────────────────────────────────────┘

두 가지 혁신적인 점

1. 대기 상태 뉴런 에이전트 (Standby Neuron Agents)

여기서 제가 깨달은 점은 이것입니다: 생물학적 뉴런은 모두 동시에 발화하지 않습니다. 어느 순간에도 약 2%만이 활성화되어 있습니다. 나머지는 조용히 대기하며 거의 아무것도 소비하지 않습니다.

그래서 저는 동일한 방식으로 작동하는 에이전트들을 구축했습니다:

DEEP_SLEEP — 디스크 상의 JSON 파일. RAM 0. 토큰 0. 오직 프롬프트 템플릿과 트리거 패턴만 존재합니다. 대부분의 에이전트가 이 상태로 존재합니다.
LIGHT_SLEEP — 중심점 벡터 (Centroid vector) 로드됨 (~3KB RAM). 에이전트가 확인합니다: "이 쿼리가 내 도메인과 일치하는가?"
ACTIVE — 관련성 점수 (relevance score)가 임계값을 초과하면 라우터 (Router)에 의해 깨어납니다. 작업을 수행합니다. 작업 직후 즉시 수면 상태로 돌아갑니다.

이들은 트리거 패턴 매칭 + 임베딩 유사도 (embedding similarity)를 통해 깨어나고, 합의 패널 (consensus panels)에서 투표하며 (모든 에이전트가 쿼리에 점수를 매기고, 상위 K개가 활성화됨), 희소 블랙보드 (sparse blackboard)를 통해 통신하고, 다시 수면 상태로 돌아갑니다.

2. 신경 발생 (Neurogenesis)

시스템이 새로운 주제를 중심으로 메모리 클러스터가 형성되는 것을 감지하면 — 예를 들어, Minecraft에 관한 6개 이상의 메모리 — 해당 도메인을 위한 새로운 전문 에이전트를 자동으로 생성 (spawns) 합니다.

만약 에이전트가 30일 동안 깨어나지 않았다면? 가지치기 (pruned) 됩니다.

이 중 그 어떤 것도 다른 곳에서는 구현하지 않은 방식입니다.

기능으로서의 수면

공고화 파이프라인 (consolidation pipeline)은 생물학적 수면처럼 작동합니다 — 재구성하고, 중복을 병합하며, 중요한 기억을 강화하고, 나머지는 쇠퇴하도록 둡:

Quick mode (빠른 모드): 60ms, LLM 호출 없음, 5분마다 실행
Full mode (전체 모드): ~3초, LLM 기반 병합 + 관계 발견 (relation discovery),
유휴 상태 감지 시 트리거 (15분 이상의 비활성 상태)

작동하나요?

Episodic Buffer (일화적 버퍼) 41/41 ✅
Memory Integration (메모리 통합) 32/32 ✅
Semantic Store (의미론적 저장소) 26/26 ✅
Knowledge Graph (지식 그래프) 37/37 ✅
Consolidation (공고화) 31/31 ✅
Standby Agents (대기 에이전트) 42/42 ✅
Cold Archive (콜드 아카이브) 27/27 ✅
Cross-Tier (E2E) (계층 간 (End-to-End)) 88/88 ✅
────────────────────────────
TOTAL (총합) 324/324 ✅

이것을 공유하는 이유

저는 슬로바키아에서 온 18세입니다. 이것은 음성 비서라는 단순한 vibecoding 프로젝트로 시작되었습니다. 하지만 메모리 문제가 저를 사로잡았고, 결코 놓아주지 않았습니다.

저를 움직이는 장기적인 목표는 다음과 같습니다: AI를 위한 더 나은 메모리가 결국 알츠하이머 (Alzheimer's)와 같은 질환에 도움이 될 수 있다고 믿습니다. 계산적 메모리 보철 (Computational memory prosthesis). 그것이 제가 탐구하고자 하는 방향입니다.

GitHub: github.com/FogyXT/JARVIS
License (라이선스): AGPL-3.0

읽어주셔서 감사합니다.