본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 09. 12:49

확률적 유사성을 넘어: 법률 도메인 내 검색 증강 생성 (RAG)의 구조적, 시간적, 인과적 한계

요약

법률 도메인에서 RAG 시스템이 겪는 환각 현상이 단순 모델 규모의 문제가 아닌, 법률 지식의 구조적 특성과 확률적 검색 간의 불일치에서 기인함을 분석합니다. 계층적, 시간적, 인과적 관점에서 기존 RAG의 한계를 정의하고 이를 해결하기 위한 새로운 아키텍처적 프레임워크를 제안합니다.

핵심 포인트

  • RAG의 실패는 확률적 검색과 법률 구조 간의 아키텍처적 불일치 때문임
  • 법률 지식의 3대 속성: 계층적 구조, 통시적 역동성, 인과적 추적 가능성
  • 기존 RAG의 3대 병리 현상: 부분-전체적 맹목성, 통시적 맹목성, 인과적 불투명성
  • 결정론적 설계를 위한 4가지 아키텍처적 약속 제안

검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 법률 AI의 신뢰성 부족 문제에 대한 표준적인 아키텍처적 대응책이 되었으나, 법원에 제출된 허위 인용문이나 현재 유효한 것으로 제시된 시대착오적인 법률 콘텐츠를 포함한 세간의 주목을 받는 실패 사례들이 여러 관할 구역에서 계속해서 나타나고 있습니다. 우리는 이러한 실패가 언어 모델 (Language Models)의 규모를 확장함으로써 제거될 수 있는 잔여적 환각 (Confabulations)이 아니라, 확률적 검색 (Probabilistic Retrieval)과 법률 지식의 계층적, 시간적, 제도적 구조 사이의 아키텍처적 불일치에서 기인하는 증상이라고 주장합니다. 우리는 세 가지 단계로 논거를 전개합니다. 첫째, 고전 법이론에서 도출할 수 있는 세 가지 속성의 삼중주로서 법률 지식의 존재론적 약속 (Ontological Commitment)을 명확히 합니다: 즉, 계층적 및 부분-전체적 (Mereological) 구조, 운영적 폐쇄성 (Operational Closure) 하에서의 통시적 역동성 (Diachronic Dynamism), 그리고 정당화 의무에 근거한 제도적 기원의 인과적 추적 가능성 (Causal Traceability)입니다. 둘째, 이에 대응하는 세 가지 검색 병리 현상(부분-전체적 맹목성 (Mereological Blindness), 통시적 맹목성 (Diachronic Blindness), 인과적 불투명성 (Causal Opacity))을 식별하며, 각각에 대해 운영적 정의, 실패 메커니즘, 전형적인 사례, 그리고 진단용 탐지 기준을 제시합니다. 셋째, 이러한 관점을 통해 최신 기술 (State of the Art)을 검토하며, 기존의 접근 방식들이 이러한 요구 사항들을 불균등하게 다루고 있으며, 이들을 상호 구성적인 요소로 취급하는 패러다임으로 아직 통합되지 않았음을 보여줍니다. 이 분석을 통해 우리는 법률 검색의 '설계에 의한 결정론적 (Deterministic-by-design)' 방향을 특징짓는 네 가지 아키텍처적 약속을 도출합니다: 존재론적 우선성 (Ontological Primacy), 사건 구체화 (Event Reification), 이중 시간적 정확성 (Bitemporal Correctness), 그리고 결정론적 상호작용 프로토콜 (Deterministic Interaction Protocols)입니다. 본 프레임워크는 식별된 규범에 작용하는 하위 작업(Downstream Tasks)보다는 법률적 쟁점 (Quaestio Juris, 어떤 규범이 적용되며 어떤 상태인가)에 초점을 맞추며, 해석적 시간 (Interpretive Time)을 명시적인 확장 영역으로 두어 주로 입법 및 헌법 검색을 다룹니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0