본문으로 건너뛰기

© 2026 Molayo

GeekNews헤드라인2026. 06. 15. 03:45

murrdb/murr - ML/AI 워크로드용 서브 밀리초 캐시

요약

Murrdb는 AI 추론 워크로드를 위한 RocksDB 기반의 NVMe/S3 캐시 시스템입니다. Parquet 및 Arrow-Flight를 지원하며, 대용량 표 형태 데이터를 효율적으로 처리하고 제로카피 와이어 프로토콜을 통해 다양한 라이브러리 배열(np.ndarray, pd.DataFrame 등)로 변환 없이 구성할 수 있습니다.

핵심 포인트

  • AI 워크로드에 최적화된 RocksDB 기반 캐시 솔루션
  • Parquet/Arrow-Flight 지원으로 대용량 배치 데이터 처리 용이
  • S3 기반 계층형 저장 및 제로카피를 통한 효율성 극대화
  • Redis 대비 S3 영속성과 비용 효율성을 제공
  • AI 추론 워크로드를 겨냥한
    RocksDB 기반 NVMe/S3 캐시로 Redis를 대체 가능

  • 배치 처리 방식의
    low-latency 제로 카피 읽기 및 쓰기에 최적화

  • 배치 데이터 파이프라인과 추론 앱 사이에 위치하는 데이터 서빙 계층으로
    Parquet 입력, Arrow-Flight 출력

  • 핫 데이터는 메모리, 콜드 데이터는 디스크에 두고 S3 기반 복제를 적용한
    계층형 저장(tiered storage)
    배치 입력·배치 출력 방식으로 컬럼형 저장 위에서 행 단위 오버헤드 없이 동작, 1GB Parquet/Arrow 파일을 Ingestion API에 그대로 투입 가능
    제로카피 와이어 프로토콜로 API 응답에서 np.ndarray/pd.DataFrame/pt.Tensor를 변환 없이 구성 가능
    무상태(stateless) 설계로 모든 상태를 S3에 보존, 블록 스토리지에서 자체 부트스트랩하므로 노드 퇴출 시에도 복구 가능
    First-class Python 지원으로 Numpy/Pandas/Polars/Pytorch 배열과 제로카피 매핑, Sparse columns는 데이터 없는 컬럼이 0바이트 차지

  • Murr가 적합한 경우

  • 데이터가 무겁고 표 형태(tabular)인 경우, S3 위의 대용량
    Parquet 덤프

  • 읽기가 배치로 이뤄지는 경우: 1000개 문서에 걸쳐 100개 컬럼을 가져오는 작업 같은 것

  • 비용을 중시하는 상황에는 디스크/S3 오프로딩이 메모리 큰 Redis 보다 운영상 더 단순하고 저렴

  • 경쟁 기술 대비 강점
    Redis 대비: S3기반 영속성 제공, 콜드 데이터를 로컬 NVMe로 오프로딩 가능

  • 임베디드
    RocksDB 대비: 생산자-추론 노드 간 데이터 동기화 직접 구축 불필요, 처음부터 분산 설계됨
    DynamoDB 대비: 쿼리당이 아닌 CPU/RAM만 과금되어 약 10배 저렴

  • 벤치마크상 packed-blob 읽기에서 Redis 대비 약
    3배, Feast 스타일 HSET에서 약 12배 빠르며 HSET 대비 약 3배 적은 RAM 사용
    범용 DB가 아니므로 OLTP는 Postgres, 분석은 Clickhouse/BigQuery/Snowflake, 범용 캐싱은 Redis 권장

  • Apache 2.0 라이선스

댓글과 토론

AI 자동 생성 콘텐츠

본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0