독일 중앙은행의 증권 투자설명서 내 적격성 기준에 대한 LLM 기반 검토
요약
독일 중앙은행의 증권 담보 적격성 검토를 위해 LLM 기반의 생성적 정보 추출 파이프라인을 제안하는 연구입니다. 기존 NER 방식의 한계를 극복하기 위해 추출, 정규화, 해석 단계로 프로세스를 분해하여 복잡한 투자설명서를 처리합니다.
핵심 포인트
- LLM을 활용한 증권 적격성 검토의 첫 번째 사례 연구 제시
- 추출, 정규화, 해석으로 분해된 생성적 정보 추출 파이프라인 도입
- LLM-as-a-judge를 통한 의미론적 가치 기반 평가 방법론 적용
- 문서 수준 적격성 검토에서 최대 91%의 높은 정밀도 달성
증권의 담보 적격성을 검증하는 것은 독일 중앙은행(German Central Bank)의 핵심 책임입니다. 그러나 길고, 반구조적(semi-structured)이며, 종종 이중 언어로 작성된 투자설명서 내에서 법적 및 재무적 기준에 따라 이러한 자산을 수동으로 검증하는 것은 자원 집약적인 작업입니다. 이전의 노력들은 정보 추출을 위해 전통적인 개체명 인식 (NER)을 활용했으나, 이러한 방법들은 OCR 노이즈, 언어적 변이, 경직된 스팬 기반(span-based) 제약 조건, 그리고 각 관련 주석 유형에 대한 수동으로 주석을 달아야 하는 학습 데이터의 필요성으로 인해 어려움을 겪을 수 있습니다. 본 논문에서 우리는 적격성 검토 프로세스에 대규모 언어 모델 (LLMs)을 적용한 첫 번째 사례 연구를 제시하며, 생성적 정보 추출 (Information Extraction) 파이프라인으로 패러다임을 전환합니다. 우리의 접근 방식은 작업을 추출(extraction), 정규화(normalization), 해석(interpretation)으로 분해하여, 노이즈가 있는 텍스트와 독일어-영어 혼용 콘텐츠를 처리하는 데 더 큰 유연성을 제공합니다. 나아가 우리는 위치 기반 지표보다 더 의미론적인 평가를 제공하는 LLM-as-a-judge를 사용한 가치 기반 평가 방법론을 도입합니다. 우리의 결과는 LLM 기반 시스템이 문서 수준의 적격성에서 높은 정밀도 (최대 91%)를 달성하며, 오탐지 수락(false acceptance)을 최소화하는 보수적인 운영 프로필을 보여줌을 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기