본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 16. 12:16

SCAR: RAG의 효율적인 컨텍스트 확장을 위한 의미론적 연속성 인지 검색

요약

RAG 시스템의 고정 길이 청킹으로 인한 경계 파편화 문제를 해결하기 위해 적응형 검색 정책인 SCAR를 제안합니다. SCAR는 쿼리-이웃 관련도와 구조적 연속성 페널티를 활용해 인접 청크를 선택적으로 확장하여 토큰 오버헤드를 줄이면서도 높은 재현율을 유지합니다.

핵심 포인트

  • 경계 파편화 문제를 해결하는 적응형 청크 확장 정책 SCAR 제안
  • 정적 윈도잉 대비 청크 사용량을 약 22.9% 감소시켜 효율성 증대
  • 임베딩 모델 간 전이 가능한 스케일 불변 결정 규칙 제공
  • 컨텍스트 토큰을 27.1% 절감하면서도 생성 충실도 유지 확인

검색 증강 생성 (Retrieval-Augmented Generation, RAG)에서 고정 길이 청킹 (Fixed-length chunking)은 종종 경계 파편화 (boundary fragmentation) 문제를 야기하며, 이로 인해 중요한 증거가 여러 세그먼트에 걸쳐 분할되어 검색 재현율 (retrieval recall)이 저하됩니다. 정적 윈도잉 (static windowing)과 부모 검색 (parent retrieval) 방식이 재현율을 개선하기는 하지만, 상당한 토큰 오버헤드를 발생시킵니다. 본 논문에서는 쿼리-이웃 관련도 (query-neighbor relevance)와 구조적 연속성 페널티 (structural continuity penalty)를 가중치로 사용하여 인접 청크를 선택적으로 확장하는 적응형 검색 정책인 SCAR (Semantic Continuity-Aware Retrieval)를 제안합니다. SCAR는 각 검색된 청크 자체의 쿼리 관련도와 연동된 상대적 확장 임계값 (relative expansion threshold)을 사용하여, 재보정 (recalibration) 없이도 임베딩 모델 간에 전이 가능한 대략적인 스케일 불변 (scale-invariant) 결정 규칙을 제공합니다. 네 가지 다양한 코퍼스 (RFC, GDPR, 10-K 보고서, 합병 계약서; N=320 쿼리; 160개 경계 파편화 쿼리)를 대상으로 실험한 결과, SCAR는 경계 파편화된 쿼리에 대해 단 7.84개의 청크만으로 92.8%의 재현율을 달성하였으며, 이는 정적 윈도잉 (10.16개 청크) 대비 22.9% 감소한 수치입니다. 쌍체 부트스트랩 테스트 (Paired bootstrap tests, B=10,000) 결과, 청크 감소는 매우 유의미하며 (p<0.0001, Cohen's d=-1.49, 큰 효과 크기), 재현율 차이는 미미함 (Cohen's d=-0.33)을 확인했습니다. 이 정책은 동일한 단일 하이퍼파라미터 설정을 사용하여 세 가지 임베딩 모델 (text-embedding-3-large, BGE-large-en-v1.5, zembed-1) 간에 전이됩니다. 또한 10-K 코퍼스에 대한 다운스트림 RAGAS 평가를 통해, SCAR가 컨텍스트 토큰을 27.1% 줄이면서도 생성 충실도 (generation faithfulness)를 유지함을 확인했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0