HN요약2026. 04. 24. 12:24

GibRAM: 인메모리 그래프 기반 RAG 워크플로우 런타임 소개

요약

GibRAM은 검색 증강 생성 (RAG) 워크플로우에 최적화된 인메모리 지식 그래프 서버입니다. 단순한 벡터 유사성 검색을 넘어, 엔티티와 관계(relationship)를 메모리에 저장하고 탐색하여 관련 문맥 정보를 끌어냅니다. 데이터는 휘발성(ephemeral)으로 관리되어 단기 분석 및 실험에 적합하며, Python SDK를 통해 청킹(chunking), 추출(extraction), 임베딩(embedding) 등 모든 구성 요소를 커스터마이징할 수 있어 높은 유연성을 제공합니다.

핵심 포인트

GibRAM은 엔티티와 관계 구조를 RAM에 저장하는 인메모리 지식 그래프 서버로, RAG의 검색 정확도를 높입니다.
단순 벡터 유사성 검색을 넘어, 그래프 탐색(Graph Traversal) 기능을 활용하여 관련 문맥 정보를 포괄적으로 검색할 수 있습니다.
데이터는 휘발성(Ephemeral)으로 설계되어 장기 저장보다는 단기 분석 및 실험에 최적화되어 있으며, 설정 가능한 TTL을 지원합니다.
Python SDK를 제공하며, 청커(Chunker), 추출기(Extractor), 임베더(Embedder) 등 핵심 컴포넌트를 교체하여 맞춤형 파이프라인 구축이 가능합니다.

Graph in-Buffer Retrieval & Associative Memory

Graph in-Buffer: Graph structure (entities + relationships) stored in RAM
Retrieval: Query mechanism for retrieving relevant context in RAG workflows
Associative Memory: Traverse between associated nodes via relationships, all accessed from memory

GibRAM is an in-memory knowledge graph server designed for retrieval augmented generation (RAG) workflows. It combines a lightweight graph store with vector search so that related pieces of information remain connected in memory. This makes it easier to retrieve related regulations, articles or other text when a query mentions specific subjects.

In memory and Ephemeral: Data lives in RAM with a configurable time to live. It is meant for short lived analysis and exploration rather than persistent storage.
Graph and Vectors Together: Stores named entities, relationships and document chunks alongside their embeddings in the same structure.
Graph aware Retrieval: Supports traversal over entities and relations as well as semantic search, helping you pull in context that would be missed by vector similarity alone.
Python SDK: Provides a GraphRAG style workflow for indexing documents and running queries with minimal code. Components such as chunker, extractor and embedder can be swapped out.

Install via script

curl -fsSL https://gibram.io/install.sh | sh
# Run server
gibram-server --insecure
Server runs on port 6161 by default.
# Run server
docker run -p 6161:6161 gibramio/gibram:latest
# With custom config
docker-compose up -d
pip install gibram

Basic Usage:

from gibram import GibRAMIndexer
# Initialize indexer
indexer = GibRAMIndexer(
session_id="my-project",
host="localhost",
port=6161,
llm_api_key="sk-..." # or set OPENAI_API_KEY env
)
# Index documents
stats = indexer.index_documents([
"Python is a programming language created by Guido van Rossum.",
"JavaScript was created by Brendan Eich at Netscape in 1995."]
)
print(f"Entities: {stats.entities_extracted}")
print(f"Relationships: {stats.relationships_extracted}")
# Query
results = indexer.query("Who created JavaScript?", top_k=3)
for entity in results.entities:
print(f"{entity.title}: {entity.score}")

Custom Components:

from gibram import GibRAMIndexer
from gibram.chunkers import TokenChunker
from gibram.extractors import OpenAIExtractor
from gibram.embedders import OpenAIEmbedder
indexer = GibRAMIndexer(
session_id="custom-project",
chunker=TokenChunker(chunk_size=512, chunk_overlap=50),
extractor=OpenAIExtractor(model="gpt-4o", api_key="..."),
embedder=OpenAIEmbedder(model="text-embedding-3-small", api_key="...")
)

MIT

AI 자동 생성 콘텐츠

원문 바로가기