
OmniRetrieval
요약
OmniRetrieval은 텍스트, SQL, RDF, 프로퍼티 그래프 등 다양한 형식의 지식을 각 방식에 맞춰 처리하는 통합 검색기입니다. 13개 데이터셋과 309개의 지식 베이스를 대상으로 자연어 라우팅을 수행합니다.
핵심 포인트
- 다양한 데이터 형식(텍스트, SQL, 그래프 등)을 지원하는 통합 검색기
- 13개 데이터셋 및 309개 지식 베이스에 대한 자연어 라우팅 구현
- NVIDIA의 Kokoro TTS 모델 최적화 버전 출시 정보 포함
왜 모든 지식을 하나의 형식으로 강제해야 할까요? 이 통합 검색기 (unified retriever)는 텍스트, SQL 테이블, RDF 그래프, 그리고 프로퍼티 그래프 (property graphs)를 각각의 방식에 맞춰 처리합니다. 13개의 데이터셋에 걸쳐 309개의 서로 다른 지식 베이스 (knowledge bases)로 자연어를 라우팅 (routing)합니다.
논문 (Paper):
https://huggingface.co/papers/2605.29250
코드 (Code):
https://github.com/JinheonBaek/OmniRetrieval
NVIDIA가 Hugging Face에 최적화된 버전의 Kokoro TTS 모델을 방금 출시했습니다.
ONNX Runtime을 통해 NVIDIA GPU에서 빠르게 실행되며, 상업적 이용이 가능한 82M 파라미터 규모의 경량 음성 합성기 (speech synthesizer)입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기