
MCompassRAG: 문단 수준 RAG를 위한 의미론적 나침반
요약
MCompassRAG는 LLM 증류를 통해 문단 수준의 RAG 성능을 최적화하는 경량 리트리버 기술입니다. 주제 메타데이터를 활용하여 추론 시 LLM 호출 없이도 높은 정보 효율성과 낮은 지연 시간을 달ai합니다.
핵심 포인트
- LLM-teacher 증류를 통한 경량 리트리버 학습
- 주제 메타데이터를 활용한 청크 표현 풍부화
- 추론 시 LLM 호출 제거로 지연 시간 5배 단축
- 정보 효율성 8.24% 향상
MCompassRAG: 문단 수준 RAG (Retrieval-Augmented Generation)를 위한 의미론적 나침반
LLM-teacher 증류 (distillation)를 통해 경량 리트리버 (retriever)를 학습시킵니다.
주제 메타데이터 (Topic metadata)가 모든 청크 (chunk) 표현을 풍부하게 만듭니다.
추론 (inference) 시 LLM 호출이 전혀 없습니다.
정보 효율성은 8.24% 더 높고, 지연 시간 (latency)은 5배 더 낮습니다.
논문 (Paper):
https://paperswithcode.co/paper/2606.18508
…
코드 (Code):
https://github.com/AmirAbaskohi/MCompassRAG
…
Ai2가 방금 Hugging Face에 Qwen 3.5 9B 터미널 에이전트 (terminal agent)를 출시했습니다.
OpenThoughts 데이터셋에서 DPPO로 구축되었으며,
Terminal Bench Lite에서 53.0%를 기록하며 TMax 절제 연구 (ablations)를 선도합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기