arXiv논문2026. 06. 17. 12:23

HistoRAG: 비판적 기술 실천을 통한 검색 증강 생성(RAG) 내 역사적 방법론의 임베딩

요약

역사학적 방법론을 RAG 아키텍처에 통합한 HistoRAG 프레임워크를 제안합니다. 시간적 윈도잉과 분리된 검색/생성 방식을 통해 기존 RAG의 시간적 왜곡과 검색 한계를 해결하며, 해석적 학문을 위한 새로운 RAG 설계 모델을 제시합니다.

핵심 포인트

역사적 원칙을 반영한 HistoRAG 프레임워크 제안
시간적 윈도잉을 통한 시대별 어휘 및 시간적 왜곡 문제 해결
검색과 생성의 분리를 통한 출처 발견과 해석의 독립성 확보
LLM을 활용한 투명하고 논쟁 가능한 관련성 평가 도입
해석적 제안으로서의 중간 텍스트(Zwischentexte) 개념 도입

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 언어 모델의 출력을 외부 증거에 기반하도록 만드는 지배적인 아키텍처이지만, 현재의 주요 평가 패러다임과 기본 설정은 여전히 사실 기반의 질의응답 (Question-Answering)에 치중되어 있습니다. 역사학 연구와 같은 해석적 학문 분야에서 RAG는 학술적 관행과 충돌하는 가설들을 내포하고 있습니다. 우리는 역사학적 원칙을 구체적인 아키텍처 개입으로 변환하는 프레임워크인 HistoRAG를 소개합니다. 분리된 검색 및 생성 (Separated retrieval and generation)은 출처 발견과 해석을 분리하며, 시간적 윈도잉 (Temporal windowing)은 역사적 탐구의 방법론적 요구 사항으로서 연구 기간 전반에 걸쳐 균형 잡힌 출처 표현을 강제하고, LLM-as-judge 평가는 관련성 판단을 투명하고 논쟁 가능하게 만듭니다. 우리는 Der Spiegel의 기사 102,189개(1950-1979년)에 적용된 SPIEGELragged를 사용하여 이러한 개입들을 평가합니다. 각 개입은 표준 RAG의 측정 가능한 결함을 해결합니다: 시대별 어휘 (Era-specific vocabulary)는 1970년대 용어를 사용할 때 1950년대의 청크 (Chunks)를 전혀 검색하지 못하며, 이는 윈도잉을 촉발하는 시간적 왜곡 (Temporal skew)의 증거가 됩니다; 벡터 유사도 (Vector similarity)와 LLM이 평가한 관련성 (Relevance)은 약한 상관관계만을 보이며 (Spearman rho = 0.275), 이는 검색 후 평가 (Post-retrieval evaluation)의 필요성을 뒷받침합니다; 키워드 기반 검색과 의미론적 검색 (Semantic retrieval)은 서로 크게 분리된 출처 풀을 드러내며, 이는 두 방식이 공유된 LLM 평가 필터 하에서 상호 보완적인 검색 계층으로 작동하는 아키텍처를 촉발합니다. 또한 우리는 LLM이 생성한 텍스트를 학술적 관행에 책임감 있게 통합하기 위한 프레임워크로서, 발견(Findings)이 아닌 해석적 제안(Interpretive proposals)으로 기능하는 중간 텍스트인 Zwischentexte (Intermediate texts)의 개념을 도입합니다. 이 아키텍처는 도메인 특화된 인식론적 약속이 어떻게 RAG 설계 결정으로 번역될 수 있는지에 대한 모델을 제공하며, 대규모 코퍼스 (Corpora)를 다루는 다른 해석적 학문 분야로도 전이될 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

HistoRAG: 비판적 기술 실천을 통한 검색 증강 생성(RAG) 내 역사적 방법론의 임베딩

요약

핵심 포인트

댓글