의미적 유사성을 넘어: 기업 신용 심사를 위한 2단계 비매개변수적 검색 워크플로우
요약
기업 신용 심사 시 발생하는 '유사성-유용성 격차' 문제를 해결하기 위해, 의미적 유사성 대신 분석적 유용성에 집중하는 2단계 비매개변수적 검색 워크플로우를 제안합니다. 이 시스템은 어휘 및 밀집 검색을 통한 후보 추출 후, LLM-as-a-Judge를 활용해 유용성 기반의 순위를 산정하며, 실제 운영 환경에서 문서 검토 시간을 수 시간에서 3분으로 단축하는 성과를 거두었습니다.
핵심 포인트
- 의미적 유사성과 의사결정 유용성 사이의 격차(Similarity-utility gap)를 해결하는 아키텍처 제안
- 어휘적 검색과 밀집 다국어 검색을 결합한 1단계 후보 검색 및 LLM 기반의 2단계 유용성 순위 산정 방식
- 재무 표와 서술형 텍스트의 구조적 충실도를 보존하는 문맥 인식 추출 모듈 적용
- 데이터 거버넌스를 위한 온프레미스 배포 및 실제 신용 분석가 대상의 실무 검증 완료
기업 신용 심사 (Corporate credit underwriting)를 수행하는 분석가들은 수백 페이지에 달하고 여러 언어로 구성된 길고 이질적인 재무 문서에서 실행 가능한 증거를 추출해야 합니다. 표준적인 검색 증강 생성 (RAG, Retrieval-Augmented Generation) 파이프라인은 의미적 유사성 (Semantic similarity)을 최적화하는데, 이는 주제적으로는 관련이 있지만 의사결정 유용성 (Decision utility)이 부족한 구절을 빈번하게 노출하는 문제를 야기하며, 우리는 이를 유사성-유용성 격차 (Similarity-utility gap)라고 정의합니다. 우리는 높은 재현율 (High-recall)의 후보 검색과 높은 정밀도 (High-precision)의 유용성 순위 산정을 분리하는 2단계 비매개변수적 (Non-parametric) 검색 아키텍처를 제안합니다. 첫 번째 단계는 어휘적 (Lexical) 검색과 밀집 다국어 (Dense multilingual) 검색을 결합하여 광범위한 후보 풀을 구축합니다. 두 번째 단계는 질의 의도 (Query intent)와 문서 구조 신호를 사용하여 후보를 필터링하는 적응형 검색 컨트롤러 (Adaptive retrieval controller)를 적용하며, 이어서 의미적 근접성 (Semantic proximity)이 아닌 분석적 유용성에 따라 구절의 순위를 매기는 LLM-as-a-Judge 유용성 점수 산정 메커니즘을 수행합니다. 문맥 인식 추출 (Context-aware extraction) 모듈은 서술형 텍스트와 복잡한 재무 표 전반에 걸쳐 구조적 충실도 (Structural fidelity)를 보존합니다. 이 시스템은 기업의 데이터 거버넌스 (Data governance) 요구 사항을 충족하기 위해 전적으로 온프레미스 (On-premise) 환경에 배포되었습니다. 분석가가 선별한 관련성 레이블이 포함된 독점 재무 문서의 다국어 코퍼스 (Corpus)를 통해 평가한 결과, 본 시스템은 단순 검색 (Naive retrieval) 베이스라인을 크게 능가했습니다. 800명 이상의 신용 분석가들이 사용하는 실제 운영 환경에 배포된 결과, 문서 검토 시간이 수 시간에서 약 3분으로 단축되었으며, 이는 문서 집약적인 의사결정 지원 워크플로우에서 유용성 인식 (Utility-aware) RAG 아키텍처의 실질적인 가치를 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기